import spacy
import pt_core_news_lg
import pandas as pd
import sys
import csv
import seaborn as sns
csv.field_size_limit(413108)
nlp = pt_core_news_lg.load()
nlp.max_length = 3174482
assistencia_social_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/assistencia_social_doria_covas.csv', sep=r'Γ')
assistencia_social_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/assistencia_social_haddad.csv', sep=r'Γ')
capitalsp_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/capitalsp_haddad.csv', sep=r'Γ')
controladoria_geral_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/controladoria_geral_doria_covas.csv', sep=r'Γ')
controladoria_geral_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/controladoria_geral_haddad.csv', sep=r'Γ')
cultura_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/cultura_doria_covas.csv', sep=r'Γ')
cultura_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/cultura_haddad.csv', sep=r'Γ')
desenvolvimento_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/desenvolvimento_doria_covas.csv', sep=r'Γ')
desenvolvimento_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/desenvolvimento_haddad.csv', sep=r'Γ')
direitos_humanos_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/direitos_humanos_doria_covas.csv', sep=r'Γ')
direitos_humanos_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/direitos_humanos_haddad.csv', sep=r'Γ')
direitos_humanos_poprua_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/direitos_humanos-poprua_doria_covas.csv', sep=r'Γ')
direitos_humanos_poprua_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/direitos_humanos-poprua_haddad.csv', sep=r'Γ')
esportes_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/esportes_doria_covas.csv', sep=r'Γ')
esportes_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/esportes_haddad.csv', sep=r'Γ')
fazenda_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/fazenda_doria_covas.csv', sep=r'Γ')
fazenda_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/fazenda_haddad.csv', sep=r'Γ')
gestao_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/gestao_haddad.csv', sep=r'Γ')
governo_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/governo_doria_covas.csv', sep=r'Γ')
governo_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/governo_haddad.csv', sep=r'Γ')
habitacao_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/habitacao_haddad.csv', sep=r'Γ')
justica_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/justica_doria_covas.csv', sep=r'Γ')
justica_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/justica_haddad.csv', sep=r'Γ')
meio_ambiente_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/meio_ambiente_haddad.csv', sep=r'Γ')
obras_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/obras_doria_covas.csv', sep=r'Γ')
obras_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/obras_haddad.csv', sep=r'Γ')
pessoa_com_deficiencia_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/pessoa_com_deficiencia_doria_covas.csv', sep=r'Γ')
pessoa_com_deficiencia_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/pessoa_com_deficiencia_haddad.csv', sep=r'Γ')
procuradoria_geral_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/procuradoria_geral_doria_covas.csv', sep=r'Γ')
procuradoria_geral_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/procuradoria_geral_haddad.csv', sep=r'Γ')
relacoes_internacionais_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/relacoes_internacionais_doria_covas.csv', sep=r'Γ')
relacoes_internacionais_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/relacoes_internacionais_haddad.csv', sep=r'Γ')
relacoes_sociais_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/relacoes_sociais_doria_covas.csv', sep=r'Γ')
relacoes_sociais_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/relacoes_sociais_haddad.csv', sep=r'Γ')
saude_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/saude_haddad.csv', sep=r'Γ')
seguranca_urbana_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana_doria_covas.csv', sep=r'Γ')
seguranca_urbana_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana_haddad.csv', sep=r'Γ')
seguranca_urbana_defesa_civil_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana-defesa_civil_doria_covas.csv', sep=r'Γ')
seguranca_urbana_defesa_civil_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana-defesa_civil_haddad.csv', sep=r'Γ')
seguranca_urbana_guarda_civil_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana-guarda_civil_doria_covas.csv', sep=r'Γ')
seguranca_urbana_guarda_civil_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana-guarda_civil_haddad.csv', sep=r'Γ')
subprefeituras_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/subprefeituras_doria_covas.csv', sep=r'Γ')
transporte_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/transporte_haddad.csv', sep=r'Γ')
transportes_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/transportes_doria_covas.csv', sep=r'Γ')
urbanismo_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/urbanismo_doria_covas.csv', sep=r'Γ')
urbanismo_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/urbanismo_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:1: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
assistencia_social_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/assistencia_social_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:2: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
assistencia_social_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/assistencia_social_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:3: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
capitalsp_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/capitalsp_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:4: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
controladoria_geral_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/controladoria_geral_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:5: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
controladoria_geral_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/controladoria_geral_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:6: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
cultura_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/cultura_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:7: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
cultura_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/cultura_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:8: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
desenvolvimento_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/desenvolvimento_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:9: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
desenvolvimento_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/desenvolvimento_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:10: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
direitos_humanos_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/direitos_humanos_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:11: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
direitos_humanos_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/direitos_humanos_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:12: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
direitos_humanos_poprua_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/direitos_humanos-poprua_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:13: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
direitos_humanos_poprua_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/direitos_humanos-poprua_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:14: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
esportes_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/esportes_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:15: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
esportes_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/esportes_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:16: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
fazenda_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/fazenda_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:17: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
fazenda_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/fazenda_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:18: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
gestao_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/gestao_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:19: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
governo_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/governo_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:20: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
governo_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/governo_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:21: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
habitacao_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/habitacao_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:22: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
justica_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/justica_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:23: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
justica_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/justica_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:24: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
meio_ambiente_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/meio_ambiente_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:25: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
obras_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/obras_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:26: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
obras_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/obras_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:27: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
pessoa_com_deficiencia_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/pessoa_com_deficiencia_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:28: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
pessoa_com_deficiencia_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/pessoa_com_deficiencia_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:29: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
procuradoria_geral_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/procuradoria_geral_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:30: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
procuradoria_geral_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/procuradoria_geral_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:31: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
relacoes_internacionais_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/relacoes_internacionais_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:32: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
relacoes_internacionais_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/relacoes_internacionais_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:33: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
relacoes_sociais_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/relacoes_sociais_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:34: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
relacoes_sociais_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/relacoes_sociais_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:35: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
saude_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/saude_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:36: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
seguranca_urbana_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:37: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
seguranca_urbana_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:38: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
seguranca_urbana_defesa_civil_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana-defesa_civil_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:39: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
seguranca_urbana_defesa_civil_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana-defesa_civil_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:40: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
seguranca_urbana_guarda_civil_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana-guarda_civil_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:41: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
seguranca_urbana_guarda_civil_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/seguranca_urbana-guarda_civil_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:42: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
subprefeituras_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/subprefeituras_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:43: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
transporte_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/transporte_haddad.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:44: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
transportes_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/transportes_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:45: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
urbanismo_doria_covas = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/urbanismo_doria_covas.csv', sep=r'Γ')
<ipython-input-2-25de01828714>:46: ParserWarning: Falling back to the 'python' engine because the separator encoded in utf-8 is > 1 char long, and the 'c' engine does not support such separators; you can avoid this warning by specifying engine='python'.
urbanismo_haddad = pd.read_csv('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/tables_clean_no_lem/urbanismo_haddad.csv', sep=r'Γ')
assistencia_social_doria_covas
| filename | text | date | lemma | clean_lem | |
|---|---|---|---|---|---|
| 0 | C:\3\DOUTORADO\NATUREZAS\1\3. NOTÍCIAS INSTITU... | \r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n SMADS d... | 0/01/2017 | SMADS dar o primeiro passo para o programa Tra... | smads dar primeiro passo programa trabalho nov... |
| 1 | C:\3\DOUTORADO\NATUREZAS\1\3. NOTÍCIAS INSTITU... | \r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n Prefeit... | 0/01/2017 | prefeitura e Governo de o estado anunciar novo... | governo estado anunciar novo parceria secretar... |
| 2 | C:\3\DOUTORADO\NATUREZAS\1\3. NOTÍCIAS INSTITU... | \r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n Secretá... | 2/01/2017 | secretária participar de diálogo com morador e... | participar dialogo morador situacao rua regiao... |
| 3 | C:\3\DOUTORADO\NATUREZAS\1\3. NOTÍCIAS INSTITU... | \r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n Prefeit... | 2/01/2017 | prefeitura instituir o programa “ São Paulo Ci... | instituir programa " linda " foto fabio arante... |
| 4 | C:\3\DOUTORADO\NATUREZAS\1\3. NOTÍCIAS INSTITU... | \r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n Trabalh... | 3/01/2017 | trabalho novo iniciar capacitação de o selecio... | trabalho novo iniciar capacitacao selecionar p... |
| ... | ... | ... | ... | ... | ... |
| 634 | C:\3\DOUTORADO\NATUREZAS\1\3. NOTÍCIAS INSTITU... | \r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n SAS Cas... | 2/05/2019 | SAS Casa Verde/Cachoeirinha viabilizar ação em... | sas casa verde cachoeirinha viabilizar acao co... |
| 635 | C:\3\DOUTORADO\NATUREZAS\1\3. NOTÍCIAS INSTITU... | \r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n Agenda ... | 2/05/2019 | agenda de o Secretário Quinta-feira , 02 de ma... | secretario maio h censo demografico viaduto ch... |
| 636 | C:\3\DOUTORADO\NATUREZAS\1\3. NOTÍCIAS INSTITU... | \r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n Encontr... | 3/05/2019 | Encontro apresentar ação desenvolver em o Prog... | encontro apresentar acao desenvolver programa ... |
| 637 | C:\3\DOUTORADO\NATUREZAS\1\3. NOTÍCIAS INSTITU... | \r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n Agenda ... | 3/05/2019 | agenda de o Secretário Sexta-feira , 03 de mai... | secretario maio h saicas av professor ascendin... |
| 638 | C:\3\DOUTORADO\NATUREZAS\1\3. NOTÍCIAS INSTITU... | \r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n Agenda ... | 4/05/2019 | agenda de o Secretário sábado , 04 de maio de ... | secretario maio h mutirao bairros - parelheiro... |
639 rows × 5 columns
from collections import Counter
import json
def token_entities(j):
tokens = nlp(''.join(str(j.text.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(110)
entities110
# with open('C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/' str(j)+'.txt', 'w') as f:
# f.write(json.dumps(entities110))
tokens = nlp(''.join(str(assistencia_social_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/assistencia_social_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('SMADS', 502),
('Centro', 207),
('Secretaria Municipal de Assistência e Desenvolvimento Social', 189),
('CTA', 184),
('CCA', 131),
('Rua Líbero Badaró', 131),
('São Paulo', 119),
('CRAS', 110),
('Adolescentes', 97),
('Assistência Social', 93),
('CREAS', 85),
('SEAS', 81),
('Wagner Origines', 80),
('Brasil', 74),
('cidade de São Paulo', 72),
('Trabalho Novo', 70),
('Filipe Sabará', 70),
('Centro Temporário de Acolhimento', 67),
('Rua', 58),
('SAS', 58),
('João Doria', 57),
('NCI', 57),
('Juliana Liba', 55),
('prefeitura de São Paulo', 53),
('Divulgação Texto', 50),
('Gabinete', 48),
('Rede Cidadã', 47),
('Centro de Acolhida', 47),
('Assistência e Desenvolvimento Social', 45),
('CEDESP', 44),
('Sala', 44),
('Chefe de Gabinete', 43),
('Francine Yamane', 41),
('Prefeitura de São Paulo', 40),
('Viaduto de o Chá', 40),
('Juliano Damasco', 37),
('ATENDE', 36),
('Programa Trabalho Novo', 35),
('Santo Amaro', 35),
('Secretário', 35),
('CAE', 34),
('Luz', 33),
('ESPASO', 33),
('SASF', 33),
('Supervisão de Assistência Social', 32),
('SMDHC', 31),
('Marcos Gabriel', 31),
('CA', 31),
('Sistema Único de Assistência Social', 30),
('Santana', 30),
('Aricanduva', 30),
('Centros Temporários de Acolhimento', 30),
('Brás', 29),
('Perus', 28),
('Lapa', 28),
('SUAS', 28),
('Vila Mariana', 27),
('Casa Florescer', 27),
('Wagner Origenes', 26),
('Sonia Francine', 26),
('Mooca', 25),
('Centros', 25),
('Atendimento Diário Emergencial', 25),
('Butantã', 24),
('Desenvolvimento Social', 23),
('Vinícius Dominichelli', 23),
('CCInter', 23),
('Centros de Acolhida', 23),
('São Mateus', 23),
('Serviço Especializado de Abordagem Social', 23),
('Alexandre', 22),
('de São Paulo', 21),
('Idosos', 21),
('SAICA', 21),
('Bruno Covas', 21),
('Luanna Marin', 21),
('Bianca Bezerra', 21),
('Espaço Vida', 20),
('Centros de referência', 20),
('Redenção', 20),
('Programa Criança Feliz', 20),
('Sala de reunião', 20),
('CCAs', 19),
('Sé', 19),
('Flickr', 19),
('Bruna Carvalho', 19),
('Páscoa', 19),
('Secretaria Especial de Investimento Social', 19),
('Barra Funda', 18),
('Unilever', 18),
('José Castro', 18),
('Parelheiros', 18),
('CJ', 17),
('CRD', 17),
('Centro Dia', 17),
('Guaianases', 17),
('Colgate', 17),
('Rua Libero Badaró', 17),
('Secretário Sexta-feira', 17),
('Governo', 16),
('Espaço Público de o Aprender Social', 16),
('Programa', 16),
('Centros de referência de Assistência Social', 16),
('Instituto Gabi', 16),
('Unibes', 16),
('Direitos Humanos e Cidadania', 15),
('SECOM', 15),
('Soninha', 15),
('SP', 15),
('Social', 15),
('Bolsa Família', 15),
('CRECI', 15),
('Defensoria Pública', 15),
('Ermelino Matarazzo', 15),
('Guilherme Fernandes', 15),
('Secretaria Especial de Comunicação', 14),
('Cracolândia', 14),
('Inova', 14),
('Santos', 14),
('Saúde', 14),
('Canindé', 14),
('CROPH', 14),
('Núcleo', 14),
('Complexo Zaki Narchi', 14),
('Anhangabaú', 14),
('Parque Novo Mundo', 14),
('Gabinete de o Prefeito', 14),
('Secretaria', 13),
('CDCM', 13),
('Coordenadoria de Atendimento Permanente e de Emergência', 13),
('Serviço de Acolhimento Institucional', 13),
('Adolescente', 13),
('SAS Santana', 13),
('INAC', 13),
('Caixa Econômica Federal', 13),
('Roni', 13),
('Ministério Público', 12),
('Central', 12),
('II', 12),
('Itaquera', 12),
('Complexo Boracea', 12),
('Bruna Carval', 12),
('Nova Luz', 12),
('Núcleo Boracea', 12),
('SMADS Texto', 12),
('Jabaquara', 12),
('Vila Maria', 12),
('Alberto Silva', 12),
('SUGESTÕES', 12),
('MuníciPes PLANO PLURIANUAL 2018-2021 ASSISTÊNCIA', 12),
('SMDE', 12),
('Bom Retiro', 11),
('Casa Verde', 11),
('Serviço de Assistência Social a o Família', 11),
('Museu de o Futebol', 11),
('Cidade Tiradentes', 11),
('Restaurante-Escola', 11),
('Bela Vista', 11),
('Suzana', 11),
('Tatuapé', 11),
('Centro POP', 11),
('Acolhida', 11),
('Serviços Especializados de Abordagem Social', 11),
('Centro de Desenvolvimento Social e Produtivo', 11),
('Cidade Ademar', 11),
('Dora', 11),
('Laura Leal', 11),
('Laura Leal Texto', 11),
('SEDS', 11),
('CPAS', 11),
('OSC', 11),
('Soninha Francine', 10),
('MSE', 10),
('Supervisões de Assistência Social', 10),
('Prates', 10),
('Saicas', 10),
('COPS', 10),
('Instituição de Longa Permanência', 10),
('Cratod', 10),
('SENAI', 10),
('Rua Prates', 10),
('São João', 10),
('AOC', 10),
('Secretaria de Assistência e Desenvolvimento Social', 10),
('Casas Bahia', 10),
('Igreja Jesus Cristo de o Santos de o Últimos Dias', 10),
('Primeira Infância', 10),
('CIEE', 10),
('Rosa', 10),
('Brigadeiro Galvão', 10),
('CTA Brigadeiro Galvão', 10),
('Mônica Quiquinato', 10),
('POT', 10),
('Jose Castro', 10),
('Heliópolis', 9),
('América Latina', 9),
('Loja Social', 9),
('Rede Social de o Centro', 9),
('Praça Princesa Isabel', 9),
('Liberdade', 9)]
tokens = nlp(''.join(str(assistencia_social_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/assistencia_social_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('SMADS', 409),
('Centro', 235),
('Luciana Temer', 199),
('Assistência Social', 197),
('CRAS', 183),
('Fernando Bassoli Bonadirman', 130),
('SAS', 126),
('Wagner Origenes', 124),
('Adolescentes', 117),
('CCA', 114),
('Secretaria Municipal de Assistência e Desenvolvimento Social', 102),
('São Paulo', 93),
('CREAS', 83),
('NCI', 83),
('Supervisão de Assistência Social', 81),
('Fernando Haddad', 61),
('Assistência e Desenvolvimento Social', 55),
('Brasil', 52),
('Viviane Bomfim', 51),
('Bolsa Família', 50),
('Cristina Cordeiro', 49),
('SASF', 47),
('CCAs', 47),
('Perus', 45),
('CEDESP', 43),
('cidade de São Paulo', 42),
('Tremembé', 40),
('SUAS', 38),
('Vila Maria', 38),
('Centro Dia', 37),
('Bairro', 35),
('Rua', 32),
('Amanda Rodrigues', 31),
('Mooca', 29),
('CJ', 29),
('Parelheiros', 28),
('Vila Guilherme', 27),
('Santana', 27),
('De Braços Abertos', 27),
('CadÚnico', 26),
('Wagner Origenes Texto', 26),
('Centro de Acolhida', 25),
('Idosos', 25),
('Beatrix Bortolai', 25),
('Nádia Campeão', 24),
('Rafael Santos', 24),
('Centros de Acolhida', 23),
('Felipe Affonso', 23),
('ESPASO', 23),
('CRAS Tremembé', 23),
('Lapa', 23),
('SP', 22),
('Fernanda Lobato', 22),
('prefeitura de São Paulo', 21),
('Anhanguera', 21),
('Denise Kanda', 21),
('Rafael Gaspar', 20),
('Pirituba', 20),
('Adolescente', 20),
('Sé', 20),
('São Mateus', 19),
('PRONATEC', 19),
('Centros', 18),
('SENAI', 18),
('Casa Verde', 18),
('Jaçanã', 18),
('Vila prudente', 18),
('CEU', 18),
('Guaianases', 18),
('de São Paulo', 17),
('CRECI', 17),
('Caio Pelegrine', 17),
('Wania Torres', 17),
('Cidade Ademar', 17),
('Núcleo de Convivência de Idosos', 17),
('Educação', 17),
('Centro Pop', 17),
('Complexo Zaki Narchi', 17),
('MDS', 16),
('Prefeitura', 16),
('Serviço de Assistência Social a o Família e Proteção Social Básica', 16),
('Jaraguá', 16),
('Direitos Humanos e Cidadania', 16),
('Centros de referência de Assistência Social', 16),
('Butantã', 16),
('Itaquera', 16),
('Maria Tereza', 16),
('Espaço de Convivência Barra Funda', 15),
('COMAS', 15),
('Dia Internacional de o Mulher', 15),
('Bela Vista', 15),
('Ana Estela Haddad', 15),
('Ermelino Matarazzo', 15),
('Cadastro Único', 15),
('Complexo Prates', 15),
('São Paulo Carinhosa', 15),
('Braços Abertos', 15),
('Vinicius Dominichelli', 15),
('Escola', 14),
('CMESCA', 14),
('Disque 100', 14),
('Pronatec', 14),
('São Miguel Paulista', 14),
('Conselho Municipal de Assistência Social', 14),
('Centro de Desenvolvimento Social e Produtivo para Adolescentes', 14),
('Barra Funda', 14),
('SENAC', 14),
('Facebook', 14),
('Victoria Mansoura', 14),
('Comissão Municipal de Enfrentamento', 13),
('Eduardo Suplicy', 13),
('Secretaria Municipal de Direitos Humanos e Cidadania', 13),
('Instituição de Longa Permanência', 13),
('Jovens e Adultos', 13),
('Espaço Público de o Aprender Social', 13),
('Núcleo de Convivência de Idoso', 13),
('Capela de o Socorro', 13),
('Centro Educacional Unificado', 13),
('Celina Filgueiras', 13),
('Cidade Tiradentes', 13),
('Pessoa com Deficiência', 12),
('Sistema Único de Assistência Social', 12),
('Juventude', 12),
('Saúde', 12),
('Campo Limpo', 12),
('CEDESPs', 12),
('Prefeitura de São Paulo', 12),
('Associação Reciclázaro', 12),
('Universidade Nove de Julho', 12),
('Fernanda Baccaro', 12),
('Mobilidade Reduzida', 11),
('FAS', 11),
('Programa Nacional de Acesso', 11),
('Centro para Juventude', 11),
('SAICAs', 11),
('Ministério Público', 11),
('Dra', 11),
('Proteção Social Básica', 11),
('Morada São João', 11),
('Pinheiros', 11),
('Itaim Paulista', 11),
('Guarda Civil Metropolitana', 11),
('Cracolândia', 11),
('Sapopemba', 11),
('Centro Pop Vila Maria', 11),
('Gabriel Chalita', 11),
('Alexandre Padilha', 11),
('Praça de o Patriarca', 10),
('Conselho Tutelar', 10),
('Santo Amaro', 10),
('CDCM', 10),
('Domicílio', 10),
('Ministério de o Desenvolvimento Social e Combate a o Fome', 10),
('Domicilio', 10),
('Serviços de Acolhimento Institucional', 10),
('SMDHC', 10),
('GCM', 10),
('UNIBES', 10),
('Governo Federal', 10),
('Bom Retiro', 10),
('Proteção Social Especial', 10),
('Direitos Humanos', 10),
('Edith de Azevedo Marques', 10),
('Obra Social Dom Bosco', 10),
('SAS Perus', 10),
('Adriano de Camargo', 10),
('Christian Koenenkamp', 10),
('Penha', 10),
('CIEE', 10),
('Centro de Acolhida Santana', 10),
('Victória Mansoura', 10),
('João Carlos Martins', 9),
('COMAS-SP', 9),
('Ensino Técnico', 9),
('Espaço de Convivência Barra', 9),
('Adolescentes Vítimas', 9),
('CROPH', 9),
('Brasília', 9),
('Zona Norte', 9),
('Isabel Bueno', 9),
('Grajaú', 9),
('Autonomia em Foco', 9),
('UNESCO', 9),
('Amsterdã', 9),
('Câmara Municipal', 8),
('Abuso e Exploração sexual Contra criança e Adolescentes', 8),
('Política de Assistência Social', 8),
('SASECOP', 8),
('Casa Restaura', 8),
('Conferência Municipal de Assistência Social', 8),
('CRD', 8),
('Baixas Temperaturas', 8),
('Santa Cecília', 8),
('Marianne Pinotti', 8),
('Unibes', 8),
('MPT', 8),
('Ministério Público de o Trabalho', 8),
('Secretaria de Assistência e Desenvolvimento Social', 8),
('Mariana Ugolini', 8),
('Lucas Pinho', 8)]
tokens = nlp(''.join(str(controladoria_geral_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/controladoria_geral_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('CGM', 416),
('SP', 196),
('Controladoria Geral de o Município', 99),
('Governo', 96),
('Gustavo Ungaro', 93),
('Lei Federal', 92),
('Controladoria Geral de o Município de São Paulo', 86),
('I de o Decreto Municipal', 83),
('São Paulo', 71),
('Controlador Geral de o Município', 68),
('COPI', 64),
('prefeitura de São Paulo', 55),
('Lei de Acesso a o Informação', 48),
('EMASP', 47),
('Coordenadoria de Promoção de o Integridade', 38),
('FOCCO', 37),
('CGM-SP', 36),
('cidade de São Paulo', 34),
('Brasil', 29),
('Abertos', 29),
('Ouvidoria Geral de o Município', 29),
('FOTO', 28),
('OGP', 28),
('Controlador Geral de o Município de São Paulo', 28),
('Serviço Público', 27),
('Ungaro', 27),
('Open Government Partnership', 26),
('Prefeitura de São Paulo', 24),
('Administração Pública', 23),
('Município de São Paulo', 22),
('SISPATRI', 22),
('Portal de o Transparência', 21),
('Rede INFO Aberta', 21),
('Escola Municipal de Administração Pública de São Paulo', 19),
('Decreto', 19),
('São Paulo Aberta', 19),
('CGU', 19),
('Lei Anticorrupção', 19),
('Parceria', 18),
('Controlador Gustavo Ungaro Quinta-Feira', 18),
('FOCCO-SP', 17),
('Controlador Gustavo Ungaro', 17),
('Secretaria Municipal de Relações Internacionais', 16),
('SMIT', 16),
('SGM', 16),
('Controlador Gustavo Ungaro Quarta-Feira', 16),
('SVMA', 15),
('Programa Agentes de Governo', 15),
('Agentes de Governo', 15),
('estado de São Paulo', 15),
('Controlador Gustavo Ungaro Sexta-Feira', 15),
('Controlador Gustavo Ungaro Terça-Feira', 15),
('Rua Líbero Badaró', 14),
('Laura Mendes Amando de Barros', 14),
('FGV', 14),
('Programa de Metas 2017-2020', 14),
('Café Hacker', 14),
('Conselho Nacional de Controle Interno', 14),
('Código de Defesa', 14),
('PMSP', 13),
('Programa', 13),
('Programa Agentes Formadores de Governo', 13),
('Prefeito Bruno Covas', 13),
('Programa “ Agentes Formadores de Governo', 13),
('Controladora Geral de o Município', 12),
('Thomaz Anderson Barbosa', 11),
('PGM', 11),
('SMJ', 11),
('Tribunal', 11),
('Estado de São Paulo', 11),
('Web Denúncia Corrupção', 11),
('Auditório de o CGM', 10),
('Controladoria', 10),
('Secretaria Municipal de Justiça', 10),
('Lei', 10),
('Câmara Municipal de São Paulo', 10),
('SMRI', 10),
('Função Pública', 10),
('Divisão de Promoção de o Ética', 10),
('Dra', 10),
('Secretaria', 10),
('Sistema de Controle de Bens Patrimoniais de o Agentes Públicos', 10),
('SMG', 10),
('Rubens Rizek', 10),
('CGE', 10),
('Ministério Público', 10),
('Junta Orçamentário Financeira', 10),
('Jaqueline de Oliveira', 9),
('Meio Ambiente', 9),
('Buenos Aires', 9),
('Secretaria Municipal de Inovação e Tecnologia', 9),
('Cidadão', 9),
('Programa de Integridade e Boas Práticas', 9),
('Rede', 9),
('CGDF', 9),
('Diálogo Paulista', 9),
('Bruno Covas', 9),
('RJ', 9),
('Thomaz Anderson Barbosa de o Silva', 8),
('Renato corte Lopes', 8),
('de o Silva', 8),
('Ouvidor Geral', 8),
('Programa de Integridade Pública Setorial', 8),
('Código de Conduta Funcional', 8),
('Audiência Pública', 8),
('Plano de Ação em Governo', 8),
('Sul', 8),
('Fundação Getúlio Vargas', 8),
('Brasília', 8),
('Café Acadêmico', 8),
('ENCCLA', 8),
('Secretário Municipal de Justiça', 8),
('Política Municipal de Transparência', 8),
('União', 8),
('Banco Mundial', 8),
('REPAC', 8),
('Secretaria Municipal de Gestão', 8),
('Fórum de Combate a o Corrupção', 8),
('Secretário Executivo', 8),
('TCM', 8),
('Plano Municipal de Governo', 8),
('Secretaria de o Governo Municipal', 8),
('Descomplica SP', 8),
('Controlador Geral', 7),
('Comunicação', 7),
('Thomaz', 7),
('Coordenadoria de Auditoria Interna', 7),
('Secretaria de o Verde', 7),
('município de São Paulo', 7),
('Código de Conduta Funcional e o Ética', 7),
('Chefe de Gabinete', 7),
('Controladora Geral', 7),
('USP', 7),
('Agenda Pública', 7),
('Administração Municipal', 7),
('Controle Interno', 7),
('PMTDA', 7),
('PIBP', 7),
('II Encontro Brasileiro de Governo', 7),
('Rede Paulista de Controladorias', 7),
('Maria Lumena Balaben Sampaio', 7),
('Maria Lumena', 7),
('Ouvidora Geral de o Município', 7),
('Fórum de Gestão Compartilhada', 7),
('Plenária', 7),
('Distrito Federal', 6),
('Decreto Municipal', 6),
('CAIN', 6),
('Coordenadoria de Promoção de o Integridade de o', 6),
('Auditor Municipal de Controle Interno', 6),
('de São Paulo', 6),
('Universidade de São Paulo', 6),
('Escola Municipal de Administração Pública', 6),
('Serviço de Informação a o Cidadão', 6),
('Corregedoria Geral de o Município', 6),
('Cooperação', 6),
('Theatro Municipal', 6),
('Coordenador de Promoção de o Integridade', 6),
('Assessoria Jurídica', 6),
('Jogo de o LAIkes', 6),
('Meta', 6),
('São Caetano', 6),
('SMDHC', 6),
('Daniel Annenberg', 6),
('Associação Paulista de Fundações', 6),
('APF', 6),
('Prodam', 6),
('Madri', 6),
('Política de Atendimento', 6),
('Tribunal de Justiça', 6),
('Premia Sampa', 6),
('III Encontro Brasileiro de Governo', 6),
('TJSP', 6),
('ICC', 6),
('IACOP', 6),
('FÓRUM PEMPAL IACOP', 6),
('SKoPJedmacedénia', 6),
('Rede de Agentes Públicos', 5),
('SMADS', 5),
('CCF', 5),
('Divisão de Fomento a o Controle Social', 5),
('Prefeitura de o Município de São Paulo', 5),
('Encontro', 5),
('Acesso a o Informação e Governo', 5),
('Agentes Formadores de Governo', 5),
('Argentina', 5),
('Geórgia', 5),
('Fazenda', 5),
('Auditores municipal de Controle Interno', 5),
('Relações Internacionais', 5),
('Controladora', 5),
('Prefeitura Municipal de São Paulo', 5),
('Centro Cultural São Paulo', 5),
('Pátio Digital', 5),
('Dinheiro', 5),
('Corregedor Geral de o União', 5),
('Luciana Russo', 5),
('Portal de dado Abertos', 5),
('Empresa de Tecnologia de o Informação e Comunicação de São Paulo', 5),
('Controladoria Geral de o União', 5)]
tokens = nlp(''.join(str(controladoria_geral_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/controladoria_geral_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('CGM', 574),
('Controladoria Geral de o Município', 352),
('CGM-SP', 225),
('São Paulo', 189),
('Controladoria', 137),
('Lei de Acesso a o Informação', 130),
('prefeitura de São Paulo', 125),
('Café Hacker', 118),
('COPI', 108),
('Prefeitura de São Paulo', 100),
('Ministério Público', 89),
('Portal de o Transparência', 88),
('PMSP', 76),
('RSSááabite', 70),
('Decreto', 67),
('SP', 62),
('CGU', 61),
('Mário Vinícius Spinelli', 59),
('cidade de São Paulo', 58),
('Spinelli', 57),
('Ouvidoria Geral de o Município', 56),
('Brasil', 51),
('Fernando Haddad', 50),
('Coordenadoria de Promoção de o Integridade', 50),
('Fernanda Campagnucci', 46),
('SPTrans', 43),
('Controladoria Geral de o Município de São Paulo', 42),
('Administração Municipal', 39),
('de São Paulo', 36),
('Lei', 36),
('Haddad', 34),
('Fabiano Angélico', 34),
('Governo', 33),
('Lei Anticorrupção', 33),
('estado de São Paulo', 32),
('Mário Spinelli', 31),
('Câmara Municipal', 31),
('Ouvidoria', 31),
('Prodam', 30),
('PL', 30),
('Galeria Olido', 30),
('FGV', 30),
('Internet', 29),
('Diário Livre', 29),
('USP', 28),
('Prefeitura', 28),
('Portal', 28),
('Conselho Municipal de Transparência e Controle Social', 27),
('São Paulo Aberta', 27),
('Diário Oficial de o Cidade de São Paulo', 27),
('Orçamento e Gestão', 26),
('Ouvidoria Geral de o Município de São Paulo', 26),
('Controlador Geral de o Município', 25),
('Polícia Civil', 25),
('Controladoria Geral de o União', 23),
('SEMPLA', 23),
('SMDU', 23),
('CET', 22),
('União', 22),
('Sociedade Civil', 22),
('Lei Federal', 21),
('Código de Conduta Funcional', 21),
('Centro', 20),
('Ouvidorias', 20),
('Coordenadoria de Auditoria Interna', 20),
('OGM-SP', 20),
('FOTO', 20),
('Universidade de São Paulo', 19),
('Brasília', 19),
('Prefeitura de SP', 19),
('Secretaria Municipal de Finanças', 18),
('Controladoria Geral', 18),
('Prefeitura Municipal de São Paulo', 18),
('Fernanda', 18),
('PR', 18),
('Administração Indireta', 18),
('Mônica Casanova', 18),
('EMASP', 18),
('Decreto Municipal', 17),
('GTI', 17),
('Maria Lumena Balaben Sampaio', 17),
('Auditor Municipal de Controle Interno', 17),
('Subprefeituras', 16),
('Meio Ambiente', 16),
('Diário Oficial de o Cidade', 16),
('Serviço de Informação a o Cidadão', 16),
('Secretaria', 16),
('Abertos', 16),
('Maria Lumena Sampaio', 16),
('Estado de São Paulo', 16),
('Roberto Porto', 15),
('Avenida São João', 15),
('Ouvidoria Geral', 15),
('SMDHC', 15),
('Tribunal', 15),
('Lumena', 15),
('Secretaria de Finanças', 15),
('Secretarias', 14),
('Projeto de Lei', 14),
('SF', 14),
('Controladoria-Geral de o União', 14),
('Secretaria Municipal de Educação', 14),
('Rio de Janeiro', 14),
('SAC', 14),
('Angélico', 14),
('Gabriel Ponzetto', 14),
('Lindalva Oliveira', 14),
('Secretaria Municipal de Planejamento', 13),
('Sempla', 13),
('Secretaria Municipal de Direitos Humanos e Cidadania', 13),
('Diário Oficial', 13),
('Município de São Paulo', 13),
('Av. São João', 13),
('Ouvidoria Geral de o Município o Ouvidoria', 13),
('Anual de Bens e Valores', 13),
('SAMU', 13),
('Prof', 13),
('Diogo Bardal', 13),
('Administração Pública', 12),
('Subprefeitura de Santo Amaro', 12),
('Consocial', 12),
('Sé', 12),
('SNJ', 12),
('Sistema de Registro de Bens de o Agentes Públicos', 12),
('Promoção de o Integridade', 12),
('América Latina', 12),
('Pública', 12),
('Ônibus', 12),
('Audiência Pública', 12),
('Recife', 12),
('Autarquia Hospitalar Municipal', 12),
('Necator', 12),
('Transparência Ativa', 12),
('Município', 12),
('SIC', 11),
('MG', 11),
('Coordenação Geral', 11),
('Câmara Municipal de São Paulo', 11),
('Secretaria Municipal de o Verde', 11),
('Lei de Acesso', 11),
('Corregedoria Geral de o Município', 11),
('Caravanas', 11),
('Governo Federal', 11),
('SPCopa', 11),
('Controle Social', 11),
('Minas Gerais', 11),
('Hackatona', 11),
('Secretaria Municipal de Desenvolvimento Urbano', 11),
('Estado', 11),
('Congresso Brasileiro de Ouvidores', 11),
('Ombudsman', 11),
('IPTU', 11),
('São Paulo Turismo', 11),
('Rede INFO', 11),
('Central de Atendimento', 10),
('OGP', 10),
('município de São Paulo', 10),
('Pernambuco', 10),
('Caravanas de o Ouvidorias', 10),
('Rio Grande de o Sul', 10),
('Café Hacker SP', 10),
('RS', 10),
('Guarda Civil Metropolitana', 10),
('CMTCS', 10),
('Londrina', 10),
('Fábio Cavazotti', 10),
('Enccla', 10),
('Transparência Internacional', 10),
('Planeja Sampa', 10),
('Catálogo Municipal de Bases', 10),
('Oficina', 10),
('CMBD', 10),
('Lei 12.846', 10),
('Colab-USP', 10),
('Fundação Getúlio Vargas', 9),
('Gisele Craveiro', 9),
('Conselho de Transparência', 9),
('Receita Federal', 9),
('RF', 9),
('Acesso a o Informação', 9),
('México', 9),
('DF', 9),
('MT', 9),
('ENCCLA', 9),
('Públicos', 9),
('Folha de S.Paulo', 9),
('Seminário', 9),
('SPTuris', 9),
('Secretaria de Finanças e Desenvolvimento Econômico', 9),
('Lei 8.989/79', 9),
('Serviço Público', 9),
('MP-SP', 9),
('Butantã', 9),
('IBGC', 9),
('Escola Municipal de Administração Pública de São Paulo', 9),
('CODUSP', 9),
('Mario Vinicius Spinelli', 8),
('Rede', 8),
('PRODAM', 8),
('Anual', 8)]
tokens = nlp(''.join(str(cultura_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/cultura_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('Zona Leste', 956),
('Zona Sul', 609),
('Zona Norte', 505),
('Secretaria Municipal de Cultura', 394),
('Zona Oeste', 373),
('Brasil', 306),
('São Paulo', 277),
('APRESENTAçãES Artísticas', 229),
('APRESENTAÇÃO ARTÍSTICA', 209),
('Tel', 199),
('Lapa', 166),
('Centro Cultural São Paulo', 152),
('Tatuapé', 146),
('CCSP', 143),
('MC INDIVIDUAL', 143),
('Livre', 135),
('Santo Amaro', 133),
('Circo', 129),
('Cia', 124),
('SP', 122),
('André Sturm', 121),
('SMC', 121),
('Centro Cultural Olido', 119),
('Casa de Cultura', 117),
('Mooca', 112),
('Teatro Arthur Azevedo', 107),
('Teatro Cacilda Becker', 106),
('Itaquera', 105),
('cidade de São Paulo', 104),
('Centro Cultural', 94),
('Teatro João Caetano', 92),
('Santana', 86),
('Teatro Décio de Almeida Prado', 80),
('Sexta', 79),
('de São Paulo', 78),
('Theatro Municipal', 75),
('Pinheiros', 74),
('Butantã', 74),
('Teatro Alfredo Mesquita', 73),
('Circuito Municipal de Cultura', 72),
('Alê Youssef', 71),
('Brasilândia', 70),
('Av. Celso Garcia', 69),
('Gabriel Fabri', 67),
('Teatro', 67),
('Biblioteca Viva', 66),
('Anhangabaú', 65),
('Biblioteca Mário de Andrade', 61),
('Virada Cultural', 61),
('Rua Tito', 59),
('Centro', 59),
('São Miguel Paulista', 59),
('República', 58),
('Teatro Paulo Eiró', 57),
('Av. Paes de Barros', 56),
('Emílio Carlos', 54),
('Vila Clementino', 53),
('Cidade Tiradentes', 53),
('Cohab José Bonifácio', 53),
('Theatro Municipal de São Paulo', 52),
('São Bento', 52),
('Vila Nova Cachoeirinha', 52),
('Centro Cultural de o Juventude', 51),
('Itaim Bibi', 51),
('Campo Limpo', 51),
('Perus', 51),
('Teatro Flávio Império', 51),
('Biblioteca Monteiro Lobato', 51),
('Despacho Interno', 51),
('Pirituba', 50),
('São João', 50),
('Despachos', 50),
('Música', 49),
('VIVÊNCIA', 49),
('Vila Formosa', 48),
('Biblioteca Gilberto Freyre', 48),
('Biblioteca Brito Broca', 47),
('Santa Cruz', 47),
('Jabaquara', 47),
('Praça de o Artes', 47),
('Rua Borges Lagoa', 46),
('Libras', 46),
('Penha', 45),
('Ipiranga', 45),
('Centro Cultural de o Penha', 44),
('CCJ', 44),
('Hip Hop', 44),
('Sapopemba', 44),
('Av. São João', 43),
('Spcine', 42),
('Av. Renata', 42),
('Biblioteca Affonso Taunay', 42),
('Paraíso', 41),
('Rio de Janeiro', 41),
('Vila Mariana', 41),
('r. José Joaquim', 41),
('Biblioteca Narbal', 40),
('Centro Cultural Tendal de o Lapa', 40),
('Sala Olido', 40),
('Vila Buarque', 40),
('Infantil', 40),
('Mário de Andrade', 39),
('Maria', 39),
('Jardim', 39),
('Biblioteca Menotti Del Picchia', 39),
('Bairro de o Limão', 39),
('Biblioteca Belmonte', 38),
('Biblioteca Amadeu Amaral', 38),
('Av. Elísio Teixeira Leite', 38),
('Biblioteca Paulo', 37),
('Biblioteca Cora Coralina', 37),
('r. São Romualdo', 37),
('INDIVIDUAL', 37),
('Quinta', 36),
('Ermelino Matarazzo', 36),
('Av. Santos Dumont', 36),
('r. Otelo Augusto Ribeiro', 36),
('Terminal de Ônibus Cachoeirinha', 36),
('r. Prof', 36),
('Biblioteca Roberto Santos', 36),
('Vila prudente', 36),
('Ó. Zona Norte', 36),
('Biblioteca Érico Veríssimo', 36),
('Freguesia de o', 36),
('Biblioteca Afonso Schmidt', 36),
('r. Andes', 36),
('Jardim de o Saúde', 36),
('r. Otto Schubart', 36),
('r. Catão', 35),
('Vila Curuçá', 35),
('Centro Cultural Vila Formosa', 35),
('Casas de Cultura', 35),
('Cohab Parada de Taipas', 35),
('Juliana Pithon Serviço', 35),
('r. Paulo Eiró', 35),
('Biblioteca Mário Schenberg', 35),
('Biblioteca Aureliano Leite', 35),
('Argentina', 34),
('Mandaqui', 34),
('r. General Jardim', 34),
('r. Taquari', 34),
('Parque de o Mooca', 34),
('Parque São Lucas', 34),
('r. Diógenes Dourado', 34),
('Grátis', 33),
('r. Antônio Maia', 33),
('r. Jaricunas', 33),
('Bairro Siciliano', 33),
('Sérgio Duarte Milliet', 33),
('r. Sampei Sato', 33),
('Biblioteca Malba Tahan', 33),
('Interlagos', 33),
('Gabriel Fabri Serviço', 32),
('r. Jaguar', 32),
('Vila Guilherme', 32),
('Biblioteca Castro Alves', 32),
('Rua Helena de o Sacramento', 32),
('tel', 32),
('r. Sena Madureira', 32),
('Av. Conselheiro Moreira de Barros', 32),
('Biblioteca Pedro Nava', 32),
('Biblioteca Marcos Rey', 32),
('Artur Alvim', 32),
('r. Brás Pires Meira', 32),
('r. José Clóvis Castro', 32),
('Av. Padre Francisco de Toledo', 32),
('sáb', 31),
('r. Abrahão Mussa', 31),
('Parque Edu Chaves', 31),
('Aclimação', 31),
('r. Cisplatina', 31),
('Vila Nova Manchester', 31),
('MC', 31),
('Biblioteca Vicente Paulo Guimarães', 31),
('Jardim Umarizal', 31),
('Biblioteca Viriato Corrêa', 31),
('Cohab Manoel de o Nóbrega', 31),
('Teatro Infantil', 31),
('r. Pedroso de Moraes', 30),
('Av. Nordestina', 30),
('Vila Maria', 30),
('Biblioteca Jayme Cortez', 30),
('Casa de Cultura de o Butantã', 30),
('Aricanduva', 30),
('Henrique Schaumann', 30),
('Luiz Gonzaga', 30),
('Biblioteca Vicente de Carvalho', 30),
('estação Vergueiro', 29),
('Centro de Formação Cultural de Cidade Tiradentes', 29),
('BMA', 29),
('Cangaíba', 29),
('Centro Cultural de o Grajaú', 29),
('Biblioteca Helena Silveira', 29),
('r. Muniz de Sousa', 29),
('Pça Haroldo Daltro', 29),
('r. Restinga', 29),
('Biblioteca Ricardo Ramos', 29),
('Biblioteca Hans Christian Andersen', 29),
('Praça Benedito Calixto', 29),
('r. Waldemar Sanches', 29)]
tokens = nlp(''.join(str(cultura_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/cultura_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('Secretaria Municipal de Cultura', 212),
('Nabil Bonduki', 175),
('Juca Ferreira', 169),
('Galeria Olido', 141),
('Centro Cultural São Paulo', 140),
('CCSP', 110),
('Brasil', 102),
('São Paulo', 82),
('Circuito Municipal de Cultura', 66),
('Cia', 65),
('Zona Leste', 64),
('Cine Olido', 62),
('Juca Ferreira Quinta-feira', 57),
('Juca Ferreira Segunda-feira', 55),
('Nabil Bonduki Quinta-feira', 55),
('Zona Sul', 53),
('SMC', 50),
('Circuito São Paulo de Cultura', 48),
('Centro Cultural de o Juventude', 47),
('Juca Ferreira Sexta-feira', 46),
('Centro Cultural Olido', 45),
('Zona Oeste', 43),
('Nabil Bonduki Sexta-feira', 43),
('Centro de Formação Cultural de Cidade Tiradentes', 41),
('Theatro Municipal', 41),
('Praça de o Artes', 40),
('Teatro Municipal', 36),
('Zona Norte', 36),
('CCJ', 34),
('Gabinete', 34),
('Centro', 33),
('cidade de São Paulo', 33),
('Maria de o Rosário Ramalho', 33),
('Sala Olido', 32),
('Cidade Tiradentes', 29),
('Japão', 28),
('Secretaria de Cultura', 27),
('de São Paulo', 27),
('Mário de Andrade', 27),
('Anhangabaú', 26),
('prefeitura de São Paulo', 25),
('Theatro Municipal de São Paulo', 24),
('Teatro Cacilda Becker', 24),
('Gabriel Fabri', 24),
('Centro Cultural', 24),
('Secretária', 24),
('Biblioteca Mário de Andrade', 23),
('Olido', 23),
('Av. São João', 23),
('Inscrições', 23),
('Lapa', 23),
('Alfredo Manevy', 22),
('Centro Cultural de o Penha', 22),
('Quinta de o Samba Rock', 22),
('Mooca Arthur Azevedo', 22),
('Teatro Martins Penna', 21),
('Sala Paissandu', 21),
('Alfredo Mesquita', 21),
('República', 21),
('São Bento', 21),
('Fernanda Matricardi Serviço', 21),
('Encontro', 20),
('Conpresp', 20),
('Teatro', 20),
('EUA', 20),
('Gabriel Fabri Serviço', 20),
('Teatro Décio de Almeida Prado', 19),
('Teatro João Caetano', 19),
('Paraíso', 19),
('Teatro Municipal Cacilda Becker', 19),
('Letícia Andrade Serviço', 19),
('Teatro Alfredo Mesquita', 17),
('Casas de Cultura', 17),
('DPH', 17),
('Centro de Memória de o Circo', 17),
('João Caetano', 17),
('Flávio Império', 17),
('Teatro Municipal João Caetano', 17),
('Virada Cultural', 16),
('Balé de o Cidade', 16),
('PIÁ', 16),
('Martins Penna', 16),
('Paulo Eiró', 16),
('Terça de Samba', 15),
('Casa de o Imagem', 15),
('Penha', 15),
('BP', 15),
('França', 15),
('América Latina', 15),
('Santana', 15),
('Biblioteca Pública', 15),
('Spcine', 15),
('Cacilda Becker', 14),
('Jornada', 14),
('Rio de Janeiro', 14),
('Nabil Bonduki Domingo', 14),
('Teatro Municipal de Santo Amaro Paulo Eiró', 14),
('Pinheiros', 13),
('Tatuapé', 13),
('Rua Tito', 13),
('Maurício Dantas', 13),
('Dir', 13),
('Luiz Gonzaga', 12),
('Viriato Corrêa', 12),
('Teatro Flávio Império', 12),
('Rio Tietê', 12),
('Vila Clementino', 12),
('Secretária -', 12),
('Balé de o Cidade de São Paulo', 11),
('CEUs', 11),
('Alceu Amoroso Lima', 11),
('Pátio de o Colégio', 11),
('Alemanha', 11),
('México', 11),
('estação Vergueiro', 11),
('Santo Amaro', 11),
('Comissão Especial de Avaliação', 11),
('Av. Santos Dumont', 11),
('Chefe de Gabinete', 11),
('Renato Soares', 11),
('Parque Ibirapuera', 10),
('Departamento de o Patrimônio Histórico', 10),
('Sala Adoniran Barbosa', 10),
('Programa Municipal de Fomento', 10),
('Avenida São João', 10),
('SP', 10),
('Shakespeare', 10),
('Teatro Leopoldo Fróes', 10),
('Prêmio Zé Renato', 10),
('Décio de Almeida Prado', 10),
('Zanoni Ferrite', 10),
('Mooca', 10),
('Hans Christian Andersen', 10),
('Rua Alexandre Davidenko', 10),
('Museu de o Cidade de São Paulo', 10),
('Itália', 10),
('Arthur Azevedo', 10),
('r. Vergueiro', 10),
('Teatro Arthur Azevedo', 10),
('Rua Borges Lagoa', 10),
('Santa Cruz', 10),
('Stok', 10),
('Secretária - Maria de o Rosário Ramalho', 10),
('Faixa', 10),
('Eloisa Elena', 10),
('São João', 9),
('Carnaval de Rua', 9),
('Monteiro Lobato', 9),
('Quarta Flow', 9),
('Orquestra Sinfônica Municipal', 9),
('Vila Formosa', 9),
('Programa', 9),
('Tom Zé', 9),
('Metrô', 9),
('China', 9),
('Plano Municipal de Cultura', 9),
('Maria', 9),
('Ipiranga', 9),
('Mário Schenberg', 9),
('Chico Buarque', 9),
('Márcio Pozzer', 9),
('Maria de o Rosário Ramalho Segunda-feira', 9),
('Teatro Municipal Alfredo Mesquita', 9),
('Sala Jardel Filho', 9),
('Secretário Municipal de Cultura', 8),
('Municipal', 8),
('Condephaat', 8),
('Prefeitura de São Paulo', 8),
('Vitrine de o Dança', 8),
('Orquestra Experimental de Repertório', 8),
('Jornada Fotográfica', 8),
('USP', 8),
('Baião de Quarta', 8),
('Rua', 8),
('Dançographismus', 8),
('Museu de o Cidade', 8),
('Centro de Formação Cultural Cidade Tiradentes', 8),
('Guilherme Varella', 8),
('Cidade', 8),
('Itaquera', 8),
('Oscar', 8),
('Maria de o Rosário Ramalho Sexta-feira', 8),
('Sesc Pinheiros', 8),
('Grátis', 8),
('Europa', 8),
('Centro Cultural Galeria Olido', 8),
('Vale de o Anhangabaú', 7),
('Fomento a o Dança', 7),
('CULTURAL', 7),
('Leopoldo Fróes', 7),
('Reino Unido', 7),
('Espanha', 7),
('Canadá', 7),
('Livre', 7),
('Rua Vergueiro', 7),
('Coordenadoria de o Sistema Municipal de Bibliotecas', 7),
('Prefeito Fernando Haddad', 7),
('Universidade de São Paulo', 7),
('Brás', 7),
('cidade de', 7)]
tokens = nlp(''.join(str(desenvolvimento_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/desenvolvimento_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('SMTE', 1210),
('CATe', 724),
('Aline Cardoso', 457),
('Secretaria Municipal de Trabalho e Empreendedorismo', 358),
('Centro de Apoio a o Trabalho e Empreendedorismo', 319),
('São Paulo', 252),
('RG', 232),
('MEI', 204),
('SMDE', 203),
('Centro', 179),
('Secretaria de Desenvolvimento Econômico', 159),
('cidade de São Paulo', 148),
('Cresan', 148),
('Tec', 146),
('Brasil', 139),
('Prefeitura de São Paulo', 136),
('Ade Sampa', 134),
('Adesampa', 133),
('Solange Borges', 127),
('prefeitura de São Paulo', 127),
('Segurança Alimentar e Nutricional', 122),
('Leonardo Pimentel', 122),
('Desenvolvimento Econômico', 116),
('Agência São Paulo de Desenvolvimento', 111),
('Cidade Tiradentes', 105),
('SMDET', 104),
('Damaris Rodrigues', 101),
('Bruno Covas', 101),
('CATes', 100),
('Microempreendedor', 98),
('Mercadão', 97),
('Secretaria Municipal de Desenvolvimento Econômico', 97),
('Itaquera', 94),
('Lapa', 90),
('Rodrigo Melo', 89),
('Butantã', 85),
('Miguel Guedes', 84),
('Secretaria', 83),
('SP', 82),
('Programa', 80),
('Pirituba', 79),
('PIS', 79),
('de São Paulo', 73),
('Santo Amaro', 70),
('Interlagos', 66),
('Trabalho e Empreendedorismo', 66),
('Av. Interlagos', 65),
('São Miguel', 65),
('Parelheiros', 64),
('Vila Maria', 63),
('Desenvolvimento Econômico e Trabalho', 62),
('Contrata SP', 61),
('Itaim Paulista', 59),
('Cosan', 58),
('Rua Augusto Carlos Bauman', 57),
('Secretaria de Desenvolvimento Econômico e Trabalho', 56),
('Cresan Vila Maria', 55),
('Cresan Butantã', 54),
('Trabalho', 53),
('CFCCT', 52),
('Jabaquara', 51),
('POT', 51),
('Av. Dr. Felipe Pinel', 49),
('Av. Rio Branco', 49),
('Av. Marechal Tito', 46),
('Secretaria Municipal de o Trabalho e Empreendedorismo', 45),
('Secretaria de Desenvolvimento Econômico de o Prefeitura de São Paulo', 45),
('Programa ter Saída', 45),
('Sampa', 44),
('Banco de Alimentos', 44),
('Secretaria de Desenvolvimento Econômico e Trabalho de o Prefeitura de São Paulo',
44),
('Penha', 43),
('Fundação Paulistana', 43),
('Fundação Paulistana de Educação', 43),
('Amlurb', 43),
('Sebrae-SP', 42),
('Brasilândia', 41),
('Sebrae', 40),
('Tecnologia e Cultura', 40),
('Arhiam Silva', 40),
('Observatório de o Gastronomia', 40),
('Santana', 39),
('Mercado Municipal Paulistano', 39),
('Pinheiros', 39),
('Programa operação Trabalho', 39),
('Pessoa com Deficiência', 39),
('Ipiranga', 38),
('Eliseu Gabriel', 38),
('Andréa Garbim', 37),
('Coordenadoria de Segurança Alimentar e Nutricional', 37),
('Centro de Formação Cultural Cidade Tiradentes', 37),
('Armando de Arruda Pereira', 36),
('Danilo Guerra', 36),
('Vila Maria Alta', 36),
('Mutirão', 36),
('Rua Voluntários de o Pátria', 35),
('Guaianases', 34),
('Zona Leste', 33),
('Rua Sobral Junior', 33),
('Sapopemba', 32),
('Taipas', 32),
('Rua Nella Murari Rosa', 32),
('João Doria', 31),
('Oficina', 31),
('Jaraguá', 30),
('Empreendedorismo', 30),
('ContrataSP', 29),
('Zona Sul', 29),
('Comusan', 28),
('Tucuruvi', 28),
('Bela Vista', 28),
('São Miguel Paulista', 28),
('Rua Guaicurus', 27),
('MEIs', 27),
('Natal', 27),
('Secretaria Municipal de Desenvolvimento Econômico e Trabalho', 27),
('cidade de', 26),
('Receita Federal', 26),
('Centro CATe Central', 26),
('Mulheres', 26),
('Kinjo Yamato', 25),
('SMADS', 25),
('Programa Trabalho Novo', 25),
('INSS', 25),
('São Mateus', 24),
('Rio Pequeno', 24),
('CATe Parelheiros', 24),
('Carteira de Trabalho', 24),
('Campo Limpo', 24),
('Vila Formosa', 23),
('Piraporinha', 23),
('Central de Captação de Vagas', 23),
('Mooca', 23),
('Assistência e Desenvolvimento Social', 23),
('Rua Sobral Júnior', 23),
('Rua Candapuí', 22),
('Brigadeiro', 22),
('Jaguaré', 22),
('estado de São Paulo', 22),
('Mutirão de', 22),
('João Moura', 21),
('Av. Sadume Inoue', 21),
('Brás', 21),
('Jd', 21),
('Direitos Humanos e Cidadania', 21),
('Insperifa', 21),
('Rua Salvador Gianetti', 20),
('Mercado Municipal de Santo Amaro', 20),
('Av. Eng', 20),
('Dasn-Simei', 20),
('Ermelino Matarazzo', 20),
('América Latina', 20),
('Centro Paula Souza', 20),
('Ministério de o Trabalho', 20),
('Facebook', 20),
('Sampa Criativa', 20),
('Fim de Ano', 20),
('Saída', 20),
('Campus Party', 19),
('Segurança Alimentar', 19),
('CATe Jabaquara', 19),
('Peixes', 19),
('CATe Itaquera', 19),
('Vale de o Anhangabaú', 19),
('Câmara Municipal de São Paulo', 19),
('Festival de Natal', 19),
('Senac', 19),
('Rua de o Cantareira', 18),
('Pátio Pari', 18),
('Anhembi', 18),
('Páscoa', 18),
('Prefeituras Regionais', 18),
('Secretaria Municipal de Assistência e Desenvolvimento Social', 18),
('Estação Hack', 18),
('CATe Itaim Paulista', 18),
('Ministério Público', 18),
('Descomplica SP', 18),
('Conselho Municipal de Segurança Alimentar e Nutricional', 17),
('Educação e Qualificação para o Mercado de Trabalho', 17),
('Luz', 17),
('Teotônio Vilela', 17),
('Feira de Artesanato', 17),
('zona Norte', 17),
('Simples Nacional', 17),
('Cid Torquato', 17),
('Zona Sul CATe Interlagos', 17),
('Autoridade Municipal de Limpeza Urbana', 17),
('Comusan-SP', 16),
('USP', 16),
('Sabão', 16),
('Dia Internacional de o Mulher', 16),
('Santos', 16),
('SMPED', 16),
('CTPS', 16),
('Zona Leste CATe Itaquera', 16),
('Zona Norte CATe Santana', 16),
('Perus', 16),
('Defensoria Pública', 16),
('Mãos e Mentes Paulistanas', 16),
('Central Leste', 15)]
tokens = nlp(''.join(str(direitos_humanos_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/direitos_humanos_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('São Paulo', 205),
('SP', 115),
('SMDHC', 104),
('Brasil', 82),
('Secretaria Municipal de Direitos Humanos e Cidadania', 80),
('Eloisa Arruda', 72),
('Direitos Humanos e Cidadania', 60),
('Rede Brasil Atual', 56),
('Bruno Covas', 50),
('Direitos Humanos', 47),
('cidade de São Paulo', 45),
('LGBTI', 40),
('Berenice Giannella', 40),
('Centro', 37),
('G1', 36),
('de São Paulo', 31),
('prefeitura de São Paulo', 31),
('Adolescente', 28),
('Prefeitura de São Paulo', 27),
('Haddad', 27),
('Rua', 25),
('Coordenação de Políticas', 23),
('Imigrantes', 22),
('CRAI', 21),
('CMDCA', 20),
('CATe', 19),
('FUMCAD', 18),
('Centro de Cidadania LGBTI', 18),
('Estadão', 18),
('ONU', 17),
('Festival de Direitos Humanos', 17),
('Casamento Coletivo Igualitário', 17),
('Catraca Livre', 17),
('Centros de Cidadania LGBTI', 16),
('Suplicy', 16),
('Atendimento', 15),
('Folha de São Paulo', 15),
('Ministério Público', 14),
('Secretaria', 14),
('ACNUR', 14),
('Santo Amaro', 14),
('Perus', 13),
('estado de São Paulo', 13),
('Zona Leste', 13),
('Unidade Móvel de Cidadania LGBTI', 13),
('Cracolândia', 12),
('Karaokê', 12),
('Bairros', 12),
('Folha', 12),
('São Miguel Paulista', 11),
('LGBT', 11),
('Cidade de São Paulo', 11),
('Cid Torquato', 11),
('Coordenação de Educação em Direitos Humanos', 11),
('Defensoria Pública', 11),
('Pessoa Idosa', 11),
('Agência Brasil', 11),
('Folha de S.Paulo', 11),
('Programa Transcidadania', 10),
('Coordenação de Políticas sobre Drogas', 10),
('Coordenação de Políticas para Mulheres', 10),
('ONG UNIESPT', 10),
('Dia SP', 10),
('Centro de Apoio a o Trabalho e Empreendedorismo', 10),
('Laura Vermont Av. Nordestina', 10),
('São Miguel Paulista Horário', 10),
('TV Globo', 10),
('EBC', 10),
('TV Brasil', 10),
('Carta Capital', 10),
('Djamila Ribeiro', 10),
('Conselho Municipal de o Direitos de o Criança', 9),
('Caribe', 9),
('Secretaria de Direitos Humanos e Cidadania', 9),
('Lei', 9),
('Secretária Municipal de Direitos Humanos e Cidadania', 9),
('Juventude', 9),
('Secretaria Municipal de o Pessoa com Deficiência', 9),
('Aline Cardoso', 9),
('Imigrantes e Promoção de o Trabalho Decente', 9),
('Selo de Direitos Humanos e Diversidade', 9),
('Centro de Cidadania Laura Vermont', 9),
('Promoção de o Igualdade Racial', 9),
('Praça de o República', 9),
('Saída', 9),
('Yunza', 9),
('Mutirão', 9),
('R7', 9),
('Brasileiros', 9),
('Bolsa Família', 9),
('Eduardo Suplicy', 8),
('América Latina', 8),
('Prefeitura Municipal de São Paulo', 8),
('Secretaria Municipal de Direitos Humanos', 8),
('Governo', 8),
('Nações Unidas', 8),
('Unidade móvel LGBT', 8),
('Festival EnTRETODOS', 8),
('Descomplica SP', 8),
('Transcidadania', 8),
('Ônibus Lilás', 8),
('Centro de Cidadania', 8),
('Bolsa Trabalho', 8),
('Zona Norte', 8),
('Sensibilização', 8),
('S', 8),
('UOL', 8),
('Santos', 7),
('IBGE', 7),
('Justiça', 7),
('Imigrante', 7),
('Vila Madalena', 7),
('Rua de o Cidadania', 7),
('Consultório', 7),
('SMPED', 7),
('Balcão de Direitos Humanos', 7),
('Imigrantes e Trabalho Decente', 7),
('Carroça de o Lucena', 7),
('My Carroça', 7),
('Coordenação de Políticas para Idosos', 7),
('Itaquera', 7),
('MUSEU', 7),
('DIVERSIDADE SEXUAL', 7),
('MDS', 7),
('Sé', 7),
('Penha', 7),
('Brás', 7),
('Grande Conselho Municipal de o Idoso', 7),
('Unidades Móveis de Cidadania LGBTI', 7),
('Região Central', 7),
('SMADS', 7),
('Microempreendedor', 7),
('MEI', 7),
('Coordenação de Políticas para LGBTI', 7),
('Dia Internacional de o Mulher', 7),
('TVT', 7),
('Rádio Brasil Atual', 7),
('João Goulart', 7),
('GCM', 6),
('Patrícia Bezerra', 6),
('Direitos', 6),
('Mães de o Luz', 6),
('Festival Entretodos', 6),
('Programação', 6),
('KARAOKÊ', 6),
('FÁBRICA ABERTA', 6),
('Cultura Brasilândia', 6),
('Políticas para Mulheres', 6),
('Português', 6),
('Saúde', 6),
('Prefeitura', 6),
('Serasa Experian', 6),
('ECA', 6),
('CMSP', 6),
('Marisa Fortunato', 6),
('União', 6),
('Lei Maria de o Penha', 6),
('Zona Sul', 6),
('Grupo gestor Intersetorial de Políticas Públicas para o Envelhecimento', 6),
('Políticas para o Pessoa Idosa', 6),
('Sodexo', 6),
('Sefras', 6),
('Centro de Cidadania LGBTI Laura Vermont', 6),
('Palmeiras', 6),
('Campus Party', 6),
('Festival Bixanagô', 6),
('Cohab-SP', 6),
('Carnaval Peruano', 6),
('estado de S.Paulo', 6),
('Rádio Justiça', 6),
('Guarda Civil Metropolitana', 5),
('Assistência e Desenvolvimento Social', 5),
('Sociedade Civil', 5),
('Conselho Municipal de o Criança', 5),
('Prefeituras Regionais', 5),
('OIT', 5),
('Ibirapuera', 5),
('Agência de o ONU para Refugiados', 5),
('Migração', 5),
('Políticas', 5),
('Ditadura Militar', 5),
('Polícia Federal', 5),
('Anhembi', 5),
('5º Festival de Direitos Humanos', 5),
('Universal de o Direitos Humanos', 5),
('CEUs', 5),
('Biografia de Mahommah Gardo Baquaqua', 5),
('Divulgação de o Grande Conselho Municipal de o Idoso', 5),
('Rio de Janeiro', 5),
('Fábricas de Cultura de o Zona Leste', 5),
('UNICEF', 5),
('Bela Vista', 5),
('Unifesp', 5),
('Decreto', 5),
('São Mateus', 5),
('Segurança Urbana', 5),
('Desenvolvimento Econômico', 5),
('Largo de o Arouche', 5),
('N', 5),
('Secretaria Municipal de Assistência e Desenvolvimento Social', 5)]
tokens = nlp(''.join(str(direitos_humanos_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/direitos_humanos_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('SMDHC', 1314),
('São Paulo', 684),
('Rogério Sottili', 678),
('Brasil', 546),
('Secretaria Municipal de Direitos Humanos e Cidadania', 538),
('Fernando Haddad', 417),
('Cidade', 368),
('Gabinete', 356),
('Direitos Humanos e Cidadania', 328),
('Despacho', 311),
('Direitos Humanos', 235),
('cidade de São Paulo', 222),
('Adolescente', 181),
('Eduardo Suplicy', 172),
('prefeitura de São Paulo', 164),
('Prefeitura de São Paulo', 157),
('CMDCA', 144),
('Rua', 139),
('Larissa Beltramim', 124),
('Perus', 121),
('de São Paulo', 119),
('Despachos', 118),
('Cine Direitos Humanos', 110),
('Felipe de Paula', 107),
('Centro', 106),
('Plano Juventude Viva', 102),
('Luz', 96),
('SP', 91),
('SME', 90),
('Assistência e Desenvolvimento Social', 90),
('Paulo Illes', 89),
('Rogério Sottili Quinta-feira', 89),
('Rogério Sottili Segunda-feira', 89),
('Edifício Matarazzo', 89),
('USP', 87),
('Sottili', 86),
('Eduardo Matarazzo Suplicy', 84),
('Luciana Temer', 83),
('SMADS', 82),
('Políticas', 80),
('Brasília', 79),
('Rogério Sottili Sexta-feira', 78),
('Haddad', 75),
('Plano', 75),
('Conselho Municipal de o Direitos de o Criança', 74),
('Transcidadania', 74),
('Centro Cultural São Paulo', 66),
('EnTRETODOS', 64),
('Secretaria de Direitos Humanos de o Presidência de o República', 63),
('estado de São Paulo', 62),
('Secretaria', 61),
('Unifesp', 61),
('Alessandro Melchior', 60),
('Espaço Itaú de Cinema', 60),
('Direito a o Memória', 59),
('SMC', 59),
('Políticas para Juventude', 58),
('Comissão', 58),
('Braços Abertos', 58),
('SECOM', 57),
('Políticas para Migrantes', 57),
('Carla Borges', 57),
('Festival', 56),
('GCM', 55),
('PopRua', 55),
('Secretaria Municipal de Educação', 54),
('Comissão Nacional de o Verdade', 53),
('Ministério de o Justiça', 53),
('Guarda Civil Metropolitana', 51),
('Largo de o Arouche', 51),
('Coordenação de Políticas para Juventude', 50),
('Juventude', 50),
('Adolescentes', 50),
('Juventude Viva', 49),
('Coordenação de Políticas para Migrantes', 49),
('Coordenação de Direito a o Memória', 48),
('ONU', 48),
('Pessoa Idosa', 47),
('FUMCAD', 47),
('Secom', 47),
('Cidade Tiradentes', 46),
('De Braços Abertos', 46),
('Educação', 45),
('Suplicy', 45),
('Rio de Janeiro', 44),
('Tata Amaral', 44),
('Parque Ibirapuera', 44),
('Praça de o Artes', 43),
('SMSU', 43),
('Universidade Aberta', 42),
('Programa', 42),
('Campo Limpo', 41),
('UNIFESP', 41),
('UAPI', 41),
('Desaparecidos Políticos', 41),
('Giordano Magri', 41),
('Comissão de o Memória e Verdade de o Prefeitura de São Paulo', 41),
('Secretaria Municipal de Direitos Humanos e Cidadania de São Paulo', 40),
('Educação em Direitos Humanos', 40),
('Grande Conselho Municipal de o Idoso', 40),
('Ana Estela Haddad', 40),
('CRAI', 40),
('Sé', 39),
('São Mateus', 39),
('Secretaria Municipal de Cultura', 39),
('Política Municipal de Participação Social', 39),
('Câmara Municipal de São Paulo', 38),
('Segurança Urbana', 38),
('Praça de o Sé', 38),
('Políticas para Idosos', 38),
('Centro de Cidadania LGBT', 38),
('Argentina', 37),
('Políticas para População', 37),
('LGBT', 37),
('Brasilândia', 37),
('Eduardo Bittar', 37),
('Gabriel Medina', 36),
('Tutelares', 36),
('CEUs', 36),
('Conselho Tutelar', 36),
('Eduardo Matarazzo Suplicy Quinta-feira', 36),
('SDH', 35),
('Nádia Campeão', 35),
('Secretaria Municipal de Saúde', 35),
('Galeria Olido', 35),
('Eduardo Matarazzo Suplicy Segunda-feira', 35),
('Saúde', 34),
('Comunicação', 34),
('Universidade Federal de São Paulo', 34),
('Ministério Público', 34),
('Entretodos', 34),
('Mooca', 33),
('PR', 33),
('SMPIR', 33),
('Cultura', 33),
('Centro de Formação Cultural Cidade Tiradentes', 33),
('Bairro', 33),
('Eduardo Matarazzo Suplicy Sexta-feira', 33),
('Djamila Ribeiro', 33),
('Políticas para LGBT', 32),
('Relações Internacionais e Federativas', 32),
('Projeto de Lei', 32),
('Luana Bottini', 32),
('Verdade de o SMDHC', 32),
('CADS', 31),
('Coordenação de Educação em Direitos Humanos', 31),
('Câmara Municipal', 31),
('Grajaú', 31),
('América Latina', 30),
('Doi-Codi', 30),
('PL', 30),
('Estatuto de o Criança', 30),
('Guiomar Lopes', 30),
('Festival de Direitos Humanos – Cidadania em o Ruas', 30),
('Cidadania em o Ruas', 30),
('Bolívia', 29),
('Parelheiros', 29),
('Polícia Federal', 29),
('Parada', 29),
('Vale de o Anhangabaú', 29),
('Rua Líbero Badaró', 29),
('Praça de o Patriarca', 29),
('Cemitério Dom Bosco', 29),
('Secretaria Municipal de Assistência e Desenvolvimento Social', 28),
('Programa de Metas', 28),
('Educação em Direitos', 28),
('Guiomar Silva Lopes', 28),
('Imigrantes', 28),
('Benetazzo', 28),
('Julian Rodrigues', 27),
('Coordenação de Políticas para LGBT', 27),
('Holanda', 27),
('Cerimônia', 27),
('Arouche', 27),
('Instituto Vladimir Herzog', 27),
('Alexandre Padilha', 26),
('Butantã', 26),
('GCMI', 26),
('Paulo Vannuchi', 26),
('Diário Oficial de o Cidade', 26),
('Bela Vista', 26),
('Estados Unidos', 26),
('SDTE', 26),
('Itaquera', 26),
('Santo Amaro', 26),
('Artur Henrique', 26),
('Marília Jahnel', 26),
('Maria Angélica Comis', 26),
('Prêmio de Direitos Humanos', 26),
('Ruas de Memória', 26),
('Decreto', 25),
('Ministério de o Saúde', 25),
('Frei Caneca', 25),
('Caixa Econômica Federal', 25),
('Maria Victoria Benevides', 25),
('Programa Transcidadania', 25),
('Antonio Benetazzo', 25),
('Facebook', 24),
('Vila Mariana', 24),
('Pronatec', 24)]
tokens = nlp(''.join(str(direitos_humanos_poprua_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/direitos_humanos-poprua_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('Rua', 15),
('Prêmio 19 de agosto', 4),
('Coordenação de Políticas para População', 4),
('Seminário de Políticas para o População', 3),
('Universidade Federal de São Paulo', 3),
('SMDHC', 3),
('Prêmio 19', 2),
('Praça de o Sé', 2),
('Dia Nacional de Luta de o População', 2),
('cidade de São Paulo', 2),
('Brasil', 2),
('Coordenação de Políticas para o População', 2),
('Secretarias municipal de Habitação e de Assistência e Desenvolvimento Social',
2),
('Banco Interamericano de Desenvolvimento', 2),
('BID', 2),
('UNIFESP', 2),
('PopRua', 2),
('Unifesp', 2),
('Habitação', 2),
('Fernando Chucre', 2),
('Direitos Humanos e Cidadania', 2),
('Berenice Giannella', 2),
('Conselho de Direitos Humanos', 2),
('Diário Oficial', 2),
('Edital', 2),
('Mauro Aulicino', 2),
('Rua Líbero Badaró', 2),
('Prêmio', 2),
('Coral de o USP', 2),
('Decreto', 1),
('Bruno Covas', 1),
('Plano Municipal de Políticas para o População de Rua', 1),
('Universal de o Direitos Humanos', 1),
('Rua o', 1),
('Sé', 1),
('Centros Pop', 1),
('Núcleos de Convivência', 1),
('Seminário de Políticas para Pessoas', 1),
('Os Desafios de Articular o Política Habitacional para o População de Rua',
1),
('São Paulo', 1),
('Câmara Municipal', 1),
('Dayane Saraiva', 1),
('Secretaria de Assistência e Desenvolvimento Social', 1),
('Herbert Barros', 1),
('Secretaria Nacional de Cidadania', 1),
('Magno Dias de o Silva', 1),
('Alessandra D’Ávila', 1),
('Nacional de Habitação', 1),
('Secretarias municipal de Direitos Humanos e Cidadania , Habitação e Assistência e Desenvolvimento Social',
1),
('ministério de o Cidades , Direitos Humanos e Desenvolvimento Social', 1),
('ONU', 1),
('Relatora Especial de Direito', 1),
('Moradia Digna', 1),
('Direitos Humanos', 1),
('Chamamento Público', 1),
('Ata de o Comissão de seleção de o Chamamento Público 013', 1),
('SMDHC/2018', 1),
('Políticas para População', 1),
('Refeitório Penaforte Mendes', 1),
('Secretaria Municipal de Assistência e Desenvolvimento Social', 1),
('CoralUSP', 1),
('Inscrições aberto !', 1),
('Natal', 1),
('Câmara de Vereadores', 1),
('Câmara de Vereadores de São Paulo', 1),
('Festival de Direitos Humanos', 1),
('Oficina Coral PopRua', 1),
('Rio de Janeiro', 1),
('Londres', 1),
('Secretaria Municipal de Direitos Humanos e Cidadania', 1),
('Núcleo de Convivência', 1),
('Refeitório Comunitário Penaforte Mendes', 1),
('Plano Municipal de Políticas para o População', 1)]
tokens = nlp(''.join(str(direitos_humanos_poprua_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/direitos_humanos-poprua_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[]
tokens = nlp(''.join(str(esportes_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/esportes_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('Centro Olímpico', 764),
('COTP', 539),
('SEME', 491),
('São Paulo', 373),
('Secretaria Municipal de Esportes e Lazer', 365),
('Centro Esportivo', 219),
('Brasil', 217),
('Pacaembu', 192),
('Jorge Damião', 135),
('Tainara Cavalcante', 129),
('cidade de São Paulo', 115),
('SP', 113),
('Pesquisa', 102),
('Sub-17', 91),
('Sub-15', 90),
('Centros Esportivos', 84),
('Corinthians', 83),
('Campeonato Paulista', 78),
('Sub-13', 73),
('João Farias', 72),
('Guilherme Guidetti', 71),
('CE', 70),
('Secretaria de Esportes e Lazer', 69),
('Jogos de o Cidade', 68),
('Feminino', 64),
('Rua Pedro de Toledo', 62),
('de São Paulo', 62),
('Bruno Pietro', 62),
('Beatriz Gois', 60),
('Estádio de o Pacaembu', 57),
('Virada Esportiva', 56),
('Vila Guarani', 54),
('Carlos Bezerra Jr.', 54),
('Gabriela de o Santos', 53),
('Ibirapuera', 52),
('Praça Charles Miller', 50),
('Carlane Borges', 50),
('Lílian Pacheco', 45),
('Masculino', 45),
('Centro Esportivo Tietê', 44),
('Rio de Janeiro', 41),
('Vila Clementino', 41),
('Circuito Caixa de o Cidadania', 41),
('Santos', 40),
('Laís de Oliveira', 40),
('Virada Esportiva 2018', 39),
('Esportes', 38),
('Taça Cidade de São Paulo', 38),
('Stefano Machado', 37),
('Juventus', 36),
('Secretário de Esportes e Lazer', 36),
('CERET', 36),
('Centro', 35),
('Guarulhos', 35),
('Jackson Quirino', 35),
('Butantã', 34),
('Segunda', 34),
('Campeonato Estadual', 34),
('Mariane Barbosa', 33),
('Vila Maria', 33),
('São Caetano', 33),
('Campeonato', 33),
('Zona Leste', 33),
('cidade de', 32),
('FUTSAL Masculino', 32),
('Daniel Alves', 31),
('Campo Limpo', 31),
('Estados Unidos', 30),
('estado de São Paulo', 30),
('Basquete', 30),
('Sub-14', 30),
('Copinha', 29),
('Rua', 29),
('Campeonato Brasileiro', 29),
('Cidade Tiradentes', 29),
('Terça', 29),
('Taubaté', 28),
('Pelezão', 28),
('Parque de o Bicicletas', 28),
('Sub', 28),
('Tai Chi Chuan', 27),
('Secretário Municipal de Esportes e Lazer', 27),
('Prefeitura de São Paulo', 27),
('Circuito Esportivo', 27),
('Vila Manchester', 26),
('Mooca', 26),
('Pirituba', 26),
('Santo Amaro', 26),
('Portuguesa', 26),
('Mirim', 26),
('Centro de Esportes Radicais', 26),
('Esportes e Lazer', 26),
('Zona Norte', 26),
('Nigéria', 26),
('Paulista', 25),
('Santana', 25),
('Museu de o Futebol', 25),
('Zona Oeste', 25),
('Sexta', 25),
('Tatuapé', 24),
('Secretaria', 24),
('Iguana Sports', 24),
('Vale de o Anhangabaú', 24),
('Zona Sul', 24),
('Carlinhos Araujo', 23),
('Argentina', 23),
('Moema', 23),
('USP', 23),
('Sub-11', 23),
('Judô', 22),
('Bruno Covas', 22),
('Ipiranga', 22),
('Barra Funda', 22),
('Centro Esportivo Vila Manchester', 22),
('Av. Paulista', 22),
('Gueitebol', 22),
('CBF', 22),
('São Bernardo de o Campo', 22),
('Sub-12', 22),
('Secretaria Municipal de Esportes e Lazer de São Paulo', 22),
('Dançar', 21),
('Circuito', 21),
('Pinheiros', 21),
('Ruas de Lazer', 21),
('Quarta', 21),
('Níger', 21),
('Federação Paulista de Futebol', 20),
('Centro Esportivo Vila Guarani', 20),
('Quinta', 20),
('Parque de o Ibirapuera', 20),
('Infantil', 20),
('Tel', 20),
('Avenida Santos Dumont', 20),
('COHAB', 20),
('Avenida Paulista', 20),
('Mauá', 20),
('Handebol', 20),
('Estádio Municipal de o Pacaembu', 20),
('Largo Coração de Jesus', 20),
('Sé', 20),
('Secretaria de Esportes', 19),
('América Latina', 19),
('Palmeiras', 19),
('São Mateus', 19),
('São José de o Campos', 19),
('Esporte Clube Pinheiros', 19),
('Japão', 19),
('Campeonato Metropolitano', 19),
('Valéria Rambaldi', 19),
('Rua Lussanvira', 19),
('Horário', 19),
('Facebook', 18),
('Centro Esportivo Ibirapuera', 18),
('Nacional', 18),
('Lapa', 18),
('Jardim São Paulo', 18),
('Modelódromo', 18),
('Peru', 18),
('Marrocos', 18),
('Gâmbia', 18),
('Gabriela Santos', 18),
('Líbano', 18),
('Hidroginástica', 18),
('Batatais', 17),
('Estádio Municipal Paulo Machado de Carvalho', 17),
('Tênis', 17),
('Av. Ibirapuera', 17),
('Ricardo Monzillo', 17),
('Ermelino Matarazzo', 17),
('CDC', 17),
('Parque de o Aclimação', 17),
('Luta Olímpica', 17),
('Juvenil', 17),
('São José', 17),
('Projeto Touché', 17),
('Venezuela', 17),
('Rua Edward Carmilo', 17),
('Jardim Celeste', 17),
('Praça Haroldo Daltro', 16),
('Flamengo', 16),
('João Dória', 16),
('Sul', 16),
('Mie Nishi', 16),
('Angola', 16),
('seleção Brasileira', 16),
('Uruguai', 16),
('FPV', 16),
('Virada Esportiva 2017', 16),
('Virada', 16),
('Cidade de São Paulo', 16),
('Centro Esportivo Ryuso Ogawa', 16),
('Praça Jânio de o Silva Quadros', 16),
('RG', 15),
('CE Vila Guarani', 15),
('Recreativo', 15),
('São Paulo de Futebol Júnior', 15),
('prefeitura de São Paulo', 15),
('Sul-Americano', 15),
('Anhangabaú', 15),
('A.D. Centro Olímpico', 15)]
tokens = nlp(''.join(str(fazenda_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/fazenda_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('IPTU', 38),
('Sua Nota Vale', 28),
('Secretaria Municipal', 27),
('prefeitura de São Paulo', 23),
('Fazenda', 21),
('Zona Sul', 15),
('Secretaria de o Fazenda', 14),
('São Paulo', 14),
('Capital', 14),
('Caio Megale', 13),
('Fazenda de São Paulo', 12),
('NFS-e', 11),
('cidade de São Paulo', 11),
('Espaço Loterias Caixa', 11),
('Prefeitura de São Paulo', 10),
('Terminal Rodoviário Tietê', 10),
('Nota', 10),
('Caixa Econômica Federal', 8),
('CAF', 8),
('Zona Leste', 8),
('Zona Oeste', 7),
('Receita Municipal', 6),
('CCM', 6),
('Novo CadloG', 6),
('Centro de Atendimento', 5),
('Fazenda Municipal', 5),
('Zona Norte', 5),
('Secretaria', 4),
('de São Paulo', 4),
('Programa de Metas', 4),
('Plano Plurianual', 4),
('São Miguel Paulista', 4),
('Notificação de Lançamento', 4),
('Praça de o Patriarca', 4),
('Lei', 4),
('Conselho Municipal de Tributos', 4),
('CMT', 4),
('Receita Federal', 4),
('Praça de Atendimento', 3),
('Secretário Municipal', 3),
('Brooklin', 3),
('Liberdade', 3),
('Parque São Rafael', 3),
('Vila de o Encontro', 3),
('Feirão Casa de o Família', 3),
('PPM', 3),
('Nota Fiscal Paulistana', 3),
('Caixa', 3),
('Centro', 3),
('Seminário de o Lei', 3),
('Bruno Covas', 3),
('LOA 2019', 3),
('Diário Oficial de o Município', 3),
('SP', 2),
('Nota Fiscal de Serviços Eletrônica', 2),
('Pedro Ivo Gândra', 2),
('Fiscais', 2),
('Serviço Eletrônicas', 2),
('NFSe', 2),
('Programa “ Sua Nota Vale', 2),
('Vila Madalena', 2),
('Vila Olímpia', 2),
('o Proposta de Lei Orçamentária Anual', 2),
('Deusdina de o Reis Pereira', 2),
('PPI', 2),
('Jardim Avelino', 2),
('Zona Sul de São Paulo', 2),
('Megale', 2),
('Imposto Predial', 2),
('Territorial Urbano', 2),
('Secretaria de o Fazenda de São Paulo', 2),
('Regional', 2),
('Vale de o Anhangabaú', 2),
('Edifício Othon', 2),
('SUREM', 2),
('Vila Sônia', 2),
('Jardim Campo Grande', 2),
('Gestão', 2),
('DECAP', 2),
('Viaduto de o Chá', 2),
('Lei Orçamentária Anual de 2019', 2),
('Projeto de Lei', 2),
('Câmara Municipal', 2),
('Lei Orgânica de o Munícipio', 2),
('Prefeituras Regionais', 2),
('Jardim Paulistano', 2),
('Cadastro de Logradouros', 2),
('Novo IPTU', 2),
('José Police Júnior', 2),
('Othon Palace Hotel', 2),
('Jardim Paulista', 2),
('Zona Oeste de São Paulo', 2),
('Bahia', 2),
('Planta Genérica de Valores', 2),
('Bairro Tremembé', 2),
('Universidades', 1),
('Certidões de Tributos e Informações Imobiliárias', 1),
('Demonstrativo Unificado de o Contribuinte', 1),
('Secretaria de o Fazenda 6', 1),
('Municipal', 1),
('Higienópolis', 1),
('Bela Vista', 1),
('Av. Berrini', 1),
('Departamento de Fiscalização de o Subsecretaria de', 1),
('Receita', 1),
('Simples Nacional', 1),
('São Paulo Operações', 1),
('Programa de Parcelamento', 1),
('32 Audiências Públicas', 1),
('Programa', 1),
('Proposta de Lei Orçamentária Anual', 1),
('AudisNCIAS Públicas DevolUTivas', 1),
('PARTICIPAÇÃO', 1),
('Prêmio', 1),
('Parque de o Independência', 1),
('Ipiranga', 1),
('Jardim Prudêncio', 1),
('Vice-presidente de fundo de Governo e Loterias de o Caixa Econômica Federal',
1),
('Prefeito João Doria', 1),
('Infração', 1),
('Programa de Parcelamento Incentivado', 1),
('Sistema Especial de Liquidação', 1),
('Custódia', 1),
('Programa ‘ Sua Nota Vale', 1),
('Programa ‘', 1),
('João Doria', 1),
('Vice-Presidente de fundo de Governo e Loterias de o Caixa Econômica Federal',
1),
('Secretaria de o Fazenda de o Prefeitura de São Paulo', 1),
('Secretaria Municipal de Habitação', 1),
('COHAB', 1),
('Pavilhão de exposição Oeste Anhembi', 1),
('São Paulo Programa', 1),
('cidade de', 1),
('Programa de Parcelamento de Multas de Trânsito', 1),
('Manual de Instruções e Perguntas e Respostas', 1),
('Fundo Municipal de Desenvolvimento de Trânsito', 1),
('Fundo Nacional de Segurança e Educação de Trânsito', 1),
('Funset', 1),
('Munícipe', 1),
('Praça de Atendimento de o Secretaria Municipal', 1),
('Imunidade e Isenção', 1),
('Devolução de Tributos', 1),
('Autuação de Processos e Parcelamentos', 1),
('Divisão de Atendimento', 1),
('Felipe Torrano', 1),
('Subsecretaria', 1),
('Torrano', 1),
('Amanda Cristina Machado', 1),
('Edson Nilson Ventura', 1),
('Cadastro de Contribuinte Mobiliário', 1),
('Prêmio de março', 1),
('Terminal Rodoviário de o Tietê', 1),
('Econômica Federal', 1),
('Gilberto Magalhães Occhi', 1),
('Prefeitura', 1),
('NF-e', 1),
('Casa Verde', 1),
('Morador de o Jardim São Bento', 1),
('Lauzane Paulista', 1),
('Morador de o Alto de o Mandaqui', 1),
('Morador de Santo Amaro', 1),
('Morador de o Jardim Bartira', 1),
('Santo Amaro', 1),
('Jardim Prudência', 1),
('Morador de o Jabaquara', 1),
('Pinheiros', 1),
('Z. Oeste', 1),
('Morador de o Vila Ida', 1),
('Água Branca', 1),
('Morador de o Água Branca', 1),
('País', 1),
('Seminário de o Secretaria Municipal', 1),
('Fazenda discutir Lei de o Estatais', 1),
('Lei de o Estatais', 1),
('Jockey Club', 1),
('Rua Boa Vista', 1),
('Paulo Uebel', 1),
('Departamento de Defesa de Capitais', 1),
('Haveres de o Município', 1),
('Subsecretaria de o Tesouro Municipal de o Secretaria de o Fazenda', 1),
('Secretaria Municipal de Gestão', 1),
('Procuradoria Geral de o Município', 1),
('Gustavo Oliveira de Macedo', 1),
('Panorama Geral de o Lei', 1),
('Angélica Petian', 1),
('Empresas Estatais', 1),
('Deloitte', 1),
('Empresas municipal', 1),
('Paulo Vitale', 1),
('Elegibilidade', 1),
('Lucas Augusto Ponte Campos', 1),
('comitê de Auditoria Estatutário e Conselho Fiscal', 1),
('Rafael Colnago', 1),
('O Processo de Auditoria em o Tribunais de contas em o Empresas Estatais',
1),
('Fredy Miller', 1),
('Fábio Coimbra', 1),
('Bruno Fagali', 1),
('Guilherme Bueno de Camargo', 1),
('Controle Interno e Auditoria Interna', 1),
('Antônio Carlos Cintra de o Amaral Filho', 1)]
tokens = nlp(''.join(str(fazenda_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/fazenda_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('Marcos Cruz', 108),
('Fernando Haddad', 84),
('Luis Massonetto', 71),
('Governo', 66),
('SP', 66),
('Marcos Cruz Segunda-feira', 52),
('Marcos Cruz Sexta-feira', 51),
('Marcos Cruz Quinta-feira', 50),
('Leda Paulani', 48),
('Desenvolvimento Urbano', 41),
('Fernando de Mello Franco', 31),
('IPTU', 28),
('Antonio Donato', 28),
('Francisco Macena', 28),
('Wilson Poit', 28),
('São Paulo', 23),
('Rodrigo Pirajá Wienskoski', 22),
('Jurídicos', 21),
('Viaduto de o Chá', 20),
('Secretaria de Finanças', 20),
('JOF', 15),
('Junta Orçamentário-Financeira', 13),
('Finanças', 13),
('Relações Governamentais', 13),
('Secretaria de Finanças e Desenvolvimento Econômico', 13),
('Beatriz Gusmão', 13),
('Robinson Barreirinhas', 12),
('prefeitura de São Paulo', 11),
('Jilmar Tatto', 11),
('Antonio Paulo Vogel', 11),
('Paulo Frateschi', 11),
('Secretaria Municipal de Finanças e Desenvolvimento Econômico', 10),
('DEC', 10),
('Roberto Garibe', 9),
('SPTrans', 9),
('Prefeitura de São Paulo', 9),
('Procurador Geral', 9),
('São Paulo Turismo', 9),
('PPI', 9),
('Programa', 8),
('Planejamento', 7),
('Obras', 7),
('Fernando Mello Franco', 7),
('Nunzio Briguglio', 7),
('Comunicação', 7),
('SP Urbanismo', 7),
('Roberto Madoglio', 7),
('Senha Web', 7),
('CMT', 6),
('Infraestrutura Urbana', 6),
('José Floriano', 6),
('Concilia SP', 6),
('Fiscalização Cidadã', 6),
('Nota Fiscal Paulistana', 5),
('cidade de São Paulo', 5),
('Eduardo Xavier', 5),
('Cesar Callegari', 5),
('Educação', 5),
('Subprefeituras', 5),
('Luis Massoneto', 5),
('Secretário Marcos Cruz', 5),
('Antonio Paulo Vogel Sexta-feira', 5),
('Conselho de Administração de o Companhia Paulistana de Securitização', 5),
('Banco Mundial', 5),
('Antonio Paulo Vogel Segunda-feira', 5),
('Município', 5),
('Marianna Sampaio', 5),
('Companhia São Paulo de Desenvolvimento e Mobilização de Ativos', 5),
('Agendamento Eletrônico', 5),
('Conselho Municipal de Tributos', 4),
('Juca Ferreira', 4),
('Ciro Biderman', 4),
('Receita Municipal', 4),
('Zona Leste', 4),
('Ricardo Teixeira', 4),
('Verde e Meio Ambiente', 4),
('Eliseu Gabriel', 4),
('Econômico', 4),
('Secretário Marcos Cruz Quinta-feira', 4),
('Nádia Campeão', 4),
('Antonio Paulo Vogel Quinta-feira', 4),
('Banco de o Brasil', 4),
('SPDA', 4),
('CEF', 4),
('Ambiente', 4),
('Tiago Rossi', 4),
('Secretaria de o Fazenda', 4),
('SUREM', 4),
('Secretaria', 4),
('Domicílio Eletrônico de o Cidadão Paulistano', 4),
('Simples Nacional', 4),
('Programa de Parcelamento Incentivado', 4),
('Rogério Ceron', 4),
('sr. Marcio Bellisomi', 3),
('Coordenação de o Subprefeituras', 3),
('José de Filippi', 3),
('Adauto Farias', 3),
('Theatro Municipal', 3),
('Anna Olimpia de Moura Leite', 3),
('Paula Motta', 3),
('Jurídico', 3),
('Município de São Paulo', 3),
('Habitação', 3),
('sr. Wilson Poit', 3),
('Desenvolvimento , Trabalho e Empreendedorismo', 3),
('SENAM', 3),
('Brasil', 3),
('de São Paulo', 3),
('Conselho de Administração de o SP', 3),
('Sat-iss', 3),
('NFS-e', 3),
('Antonio Carlos Cintra Amaral', 3),
('SPSec', 3),
('Caixa Econômica Federal', 3),
('Evaldo Borges', 3),
('Procuradoria Geral de o Município', 3),
('Fazenda', 3),
('Praça de Atendimento', 3),
('Praça de Atendimento de o Secretaria de Finanças', 3),
('Imposto Sobre Serviços de qualquer Natureza – iss', 3),
('Taxa de Fiscalização de Estabelecimentos', 3),
('Taxa de Fiscalização de Anúncios', 3),
('TFA', 3),
('SUPs', 3),
('Fitch Ratings', 3),
('Cidade', 3),
('Tribunal de Justiça', 3),
('PGE', 3),
('Guia de o Contribuinte', 3),
('Secretaria Municipal de Finanças', 3),
('Edifício Matarazzo', 2),
('Santos', 2),
('Rio de Janeiro', 2),
('Brasília', 2),
('Cidade de São Paulo', 2),
('Imposto', 2),
('Serviço', 2),
('Rede PNAFM', 2),
('PRODAM', 2),
('Gestão Econômico Financeira', 2),
('Junta Orçamentário - Financeira', 2),
('Conselho Fiscal', 2),
('Rua Boa Vista', 2),
('Rua Líbero Badaró', 2),
('Auditório', 2),
('Prefeitura Municipal de São Paulo', 2),
('Secretário Luis Massonetto', 2),
('Assessor Econômico', 2),
('Luis Felipe Vidal', 2),
('Licenciamentos', 2),
('José de Filippi Junior', 2),
('Osvaldo Spuri', 2),
('Douglas amato', 2),
('Fernando Fleury', 2),
('Programa de Incentivos', 2),
('Itaquera', 2),
('Alexandre Ribeiro Pereira Lopes', 2),
('ITBI', 2),
('Ursula Dias Peres', 2),
('Fabio Pereira', 2),
('Fernando Rodrigues', 2),
('Alexandre Lutterbach', 2),
('Licenciamento', 2),
('Paula Motta Lara', 2),
('Administrações Tributárias', 2),
('Marcelo Lacerda', 2),
('Google', 2),
('Secretário Marcos Cruz Segunda-feira', 2),
('Conselho de Administração de o Companhia São Paulo de Desenvolvimento de Ativos',
2),
('Secretário Marcos Cruz Sexta-feira', 2),
('Bruno Rocha Nagli', 2),
('Parsons Brasil', 2),
('Luiz Bueno', 2),
('Odebrecht Infraestrutura', 2),
('Mário Spinelli', 2),
('Jacques Yazbek', 2),
('COHAB', 2),
('Universidade de São Paulo', 2),
('Sistema Autenticador', 2),
('Transmissor de documento Fiscais Eletrônicos', 2),
('Nota Fiscal de Serviços Eletrônica', 2),
('IPREM-SP', 2),
('Fernando Mello', 2),
('Marcelo Fonseca Ignatios', 2),
('Fundação BRAVA', 2),
('Conselho de Administração de o Companhia São Paulo de Desenvolvimento e Mobilização de Ativos',
2),
('América Latina', 2),
('Departamento Fiscal', 2),
('FISC', 2),
('Ernest & Young', 2),
('Laercio Cosentino', 2),
('7/04/2014', 2),
('Fernando Pieroni', 2),
('Estruturadora Brasileira de Projetos', 2),
('Marcos Vasconcelos', 2),
('Simão Pedro', 2),
('Gustavo Partezani Rodrigues', 2),
('Guilherme Bueno de Camargo', 2),
('Jose Fernando Ferreira Brega', 2),
('Secretaria de negócio Jurídicos', 2)]
tokens = nlp(''.join(str(gestao_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/gestao_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('Sempla', 176),
('Prefeito', 141),
('Orçamento e Gestão', 115),
('Programa de Metas', 110),
('Secretário', 82),
('Secretária', 76),
('SEMPLA', 75),
('USP', 75),
('Marcos Cruz', 69),
('Secretária Sexta-feira', 68),
('PRODAM', 66),
('SF', 63),
('Leda Paulani', 62),
('PPA', 57),
('prefeitura de São Paulo', 56),
('Câmara Municipal', 56),
('Secretaria de Planejamento', 56),
('Prefeitura de São Paulo', 53),
('SGM', 51),
('Meta', 49),
('Antonio Donato', 45),
('Secretaria Municipal de Planejamento', 44),
('DESS', 44),
('Secretária Segunda-feira', 44),
('Coordenadoria de Gestão de Pessoas', 42),
('Programa de Metas 2013-2016', 42),
('Secretária Quinta-feira', 42),
('Gestão', 39),
('SMG', 38),
('Luis Massoneto', 37),
('Fernando Mello', 37),
('Junta Orçamentária Financeira', 36),
('PMSP', 35),
('Programa', 34),
('Prefeito e Secretários', 34),
('Junta Orçamentário-Financeira', 33),
('Secretária quarta-feira', 33),
('São Paulo', 32),
('Secretário Sexta-feira', 30),
('Fernando Haddad', 29),
('LDO', 29),
('Despacho', 29),
('Planeja Sampa', 29),
('Controladoria Geral de o Município', 28),
('Cidadão', 28),
('Francisco Macena', 28),
('CPOP', 27),
('Luis Massonetto', 27),
('Ciclo Participativo de Planejamento e Orçamento', 26),
('SNJ', 25),
('cidade de São Paulo', 25),
('Governo', 24),
('GEq', 24),
('Conselho de Planejamento e Orçamento Participativos', 24),
('Secretário Quinta-feira', 24),
('Cogep', 23),
('CGM', 23),
('COGEP', 22),
('Decreto', 22),
('Facebook', 22),
('Planejamento', 21),
('SINP', 21),
('CIEE', 21),
('Superintendente de o IPREM', 21),
('SMDU', 21),
('Jurídicos', 20),
('Programa de Metas de o Cidade de São Paulo', 20),
('Departamento de Saúde de o Servidor', 20),
('Emasp', 20),
('Escola de Formação de o Servidor Público Municipal', 19),
('Plano Plurianual', 19),
('Vice-Prefeita', 19),
('Secretaria Municipal de Gestão', 19),
('PL', 18),
('Secretário Marcos Cruz', 18),
('Gabinete de o Prefeito', 18),
('Lei Orçamentária Anual', 18),
('Semana Universitária', 18),
('Secretário Segunda-feira', 18),
('Diário Oficial de o Cidade', 17),
('Coordenadora de Planejamento', 17),
('Subprefeituras', 16),
('Prêmio', 16),
('secretária de Planejamento', 16),
('Saúde', 16),
('Secretarias', 15),
('DGDP', 15),
('Prodam', 15),
('Internet', 15),
('Programa Gestão de Equipes', 15),
('Gabinete', 15),
('Chefe de Gabinete', 15),
('Mooca', 15),
('EFSPM', 14),
('Educação', 14),
('Brasil', 14),
('Secretário de o Saúde', 14),
('José Floriano', 14),
('Coordenadoria de Planejamento', 14),
('GTI', 14),
('Secretário Substituto', 14),
('Secretário de Finanças', 14),
('Paulo Frateschi', 14),
('Administração Pública', 13),
('Município', 13),
('Conselho de o Cidade', 13),
('Coordenadora', 13),
('CMSP', 13),
('Coordenadora de Gestão de Pessoas', 13),
('Conselho de Administração de o PRODAM', 13),
('SJ', 13),
('Ploa 2015', 13),
('DGPI', 12),
('Sistema de Negociação Permanente', 12),
('Escola', 12),
('Vila Maria', 12),
('Parelheiros', 12),
('SP', 12),
('Secretários', 12),
('Secretário Adjunto', 12),
('Ermelino Matarazzo', 12),
('Paulo Fernandes', 12),
('SMSP', 12),
('Coordenadores', 12),
('Vice-Prefeita e Secretários', 12),
('Observa Sampa', 12),
('Ursula Peres', 11),
('IPTU', 11),
('Escola de o Servidor', 11),
('Programa de Metas 2013', 11),
('Capela de o Socorro', 11),
('Secretário José Floriano', 11),
('Café Hacker', 11),
('Conselho', 11),
('Almoço', 11),
('Empresa de Tecnologia de o Informação e Comunicação de o Município de São Paulo',
11),
('CACISP', 11),
('Escola Municipal de Administração Pública de São Paulo', 11),
('Sistema Eletrônico de Informações', 11),
('Administração Municipal', 10),
('Municipal', 10),
('IPREM', 10),
('Atendimento', 10),
('Secretário de Relações Governamentais', 10),
('Projeto de Lei', 10),
('Ana Guerrini', 10),
('Câmara Municipal de São Paulo', 10),
('Gustavo Vidigal', 10),
('Secretário Paulo Frateschi', 10),
('Rede Nossa São Paulo', 9),
('Lei', 9),
('Praça de Atendimento', 9),
('Guarda Civil Metropolitana', 9),
('COAFI', 9),
('de São Paulo', 9),
('Campo Limpo', 9),
('Sindicato de o Engenheiros', 9),
('Leda', 9),
('SUS', 9),
('COBES', 9),
('Secretário Antonio Donato', 9),
('Assessoria de Comunicação e Imprensa', 9),
('Celso Jatene', 9),
('CPPO', 9),
('Assessoria de Comunicação e Imprensa Secretaria de Planejamento', 9),
('Observatório de Indicadores de o Cidade de São Paulo', 9),
('Procurador Geral', 9),
('CGTIC', 9),
('Coordenadora de Atendimento', 9),
('Cacisp', 9),
('Tribunal Regional Federal', 9),
('Coordenador de Relações de o Trabalho', 9),
('Arquitetos', 9),
('Agrônomos', 9),
('Mário Spinelli', 8),
('Rogério Ceron', 8),
('Santo Amaro', 8),
('SME', 8),
('SECOM', 8),
('Aricanduva', 8),
('Prefeitura Municipal de São Paulo', 8),
('Brasilândia', 8),
('Pirituba', 8),
('Perus', 8),
('Ipiranga', 8),
('Cidade Tiradentes', 8),
('Rodrigo Teixeira', 8),
('Mariana Almeida', 8),
('Juca Ferreira', 8),
('Secretário Simão Pedro', 8),
('Itaim Paulista', 8),
('Sé', 8),
('Conselho de o PRODAM', 8),
('SIURB', 8),
('Secretário Substituto Sexta-feira', 8),
('HSPM', 8),
('Sampa', 8),
('Roberto Porto', 8),
('SEI', 8),
('Secretaria', 7)]
tokens = nlp(''.join(str(governo_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/governo_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('PMI', 90),
('Secretaria Municipal de Desestatização e Parcerias', 56),
('Diário Oficial', 55),
('SMDP', 53),
('Diário Oficial de o Município', 53),
('PPMI', 48),
('prefeitura de São Paulo', 41),
('Pacaembu', 38),
('Wilson Poit', 37),
('São Paulo', 35),
('SPTuris', 30),
('Procedimento de manifestação de Interesse', 29),
('Ibirapuera', 29),
('Prefeitura de São Paulo', 28),
('Plano Municipal de Desestatização', 23),
('Desestatização', 22),
('Complexo Pacaembu', 21),
('Centro Poliesportivo', 19),
('Secretaria', 19),
('Mercado Municipal de Santo Amaro', 19),
('Câmara Municipal', 18),
('Lajeado', 18),
('Jardim Felicidade', 18),
('Zona Azul', 18),
('Complexo de o Pacaembu', 17),
('Fundo Municipal de Desenvolvimento Social', 17),
('Anhembi', 17),
('PIU', 17),
('Secretaria de Desestatização e Parcerias', 16),
('Governo', 16),
('Santo Amaro', 16),
('Projeto de Intervenção Urbana', 16),
('Jacintho Alberto', 16),
('Eucaliptos', 16),
('Estádio Municipal Paulo Machado de Carvalho', 15),
('cidade de São Paulo', 15),
('Tenente Brigadeiro Faria Lima', 15),
('Procedimento Preliminar de manifestação de Interesse', 14),
('João Doria', 13),
('Complexo Anhembi', 13),
('Imposto Sobre Serviços', 13),
('Desestatização e Parcerias', 12),
('Comissão Especial de Avaliação', 12),
('Brasil', 12),
('Princesa Isabel', 12),
('Legislativo', 11),
('Projeto de Lei', 11),
('Lapa', 11),
('Campo Limpo', 11),
('Bruno Covas', 11),
('de São Paulo', 10),
('Complexo', 10),
('Conpresp', 10),
('PL', 10),
('CET', 10),
('Terminal de Ônibus Princesa Isabel', 10),
('Terminal Princesa Isabel', 10),
('Verde', 9),
('CONDEPHAAT', 9),
('Capelinha', 9),
('Tribunal', 9),
('Meio Ambiente', 8),
('SP', 8),
('Autódromo de Interlagos', 8),
('FMD', 8),
('Pirituba', 8),
('Instituto Semeia', 8),
('BID', 8),
('PMSP', 8),
('Município', 8),
('Assunção', 8),
('Conselho Municipal de Preservação de o Patrimônio Histórico , Cultural e Ambiental de o Cidade de São Paulo',
7),
('Lei', 7),
('Mercadão', 7),
('Mobilidade e Transportes', 7),
('Vila Mariana', 7),
('Prefeitura Municipal de São Paulo', 7),
('Mercado de Santo Amaro', 7),
('Parque Ibirapuera', 7),
('Secretaria Municipal de Desestatização e Parcerias promover um Audiência Pública',
7),
('Internacional', 7),
('SVMA', 7),
('Nacional', 7),
('Concessionária', 7),
('Parque Chácara de o Jockey', 7),
('Secretarias de o Governo', 7),
('Aclimação', 6),
('Conselho de Defesa de o Patrimônio Histórico Arqueológico', 6),
('Artístico e Turístico', 6),
('Imóveis', 6),
('SMUL', 6),
('Zona Norte', 6),
('São Paulo Turismo S.A.', 6),
('Tribunal de contas de o Município', 6),
('Secretaria Municipal de Esportes e Lazer', 6),
('Transição', 6),
('Auditório de o EMASP', 6),
('Primeira Infância', 6),
('Parque Municipal Chácara', 6),
('B3', 6),
('Município de São Paulo', 5),
('Secretário Municipal', 5),
('BNDES', 5),
('São Paulo Parcerias', 5),
('Conselho Municipal de Desestatização e Parcerias', 5),
('Concessões', 5),
('Bilhete Único', 5),
('Serviço Funerário', 5),
('Sistema de Bilhetagem', 5),
('Vila Nova Cachoeirinha', 5),
('Museu Aeroespacial', 5),
('SMTE', 5),
('Mobilidade', 5),
('João Octaviano Machado Neto', 5),
('Aparelhos', 5),
('Companhia de Engenharia de Tráfego', 5),
('ABNT', 5),
('operação Assistida', 5),
('Rua Boa Vista', 5),
('LPUOS', 5),
('Jabaquara', 5),
('Cidade Tiradentes', 5),
('Poder Concedente', 5),
('Edital', 5),
('Mauro Ricardo Costa', 5),
('Carmo', 4),
('Secretaria de o Verde', 4),
('Chácara de o Jockey', 4),
('Câmara Municipal de São Paulo', 4),
('Terminais de Ônibus', 4),
('LEI Nº', 4),
('Concessão de o Complexo de o Pacaembu', 4),
('Kinjo Yamato', 4),
('Governo de o Estado', 4),
('Lei Municipal', 4),
('Parelheiros', 4),
('Penha', 4),
('Parques', 4),
('Terminais de Ônibus Urbanos', 4),
('Heloísa Proença', 4),
('Administração Municipal', 4),
('Parque Campo de Marte', 4),
('Prefeitura', 4),
('União', 4),
('Zona Sul', 4),
('Verde e Meio Ambiente', 4),
('STJ', 4),
('DO', 4),
('ZOE', 4),
('Banco Interamericano de Desenvolvimento', 4),
('Due Diligence', 4),
('Participação Acionária', 4),
('Indianópolis', 4),
('Bosque de o Saúde e Jabaquara', 4),
('Associação de o Permissionários', 4),
('APEMSA', 4),
('Eduardo de Castro', 4),
('Guaianases', 4),
('Parque', 4),
('Continuidade', 4),
('SEME •', 4),
('Associação Brasileira de Normas Técnicas', 4),
('Coletiva de Imprensa', 4),
('Radial Leste', 4),
('Escola Municipal de Administração Pública de São Paulo', 4),
('Edifício Jockey Club', 4),
('TCM', 4),
('Apresentação e Análise de o Projeto Técnico Operacional', 4),
('Audiência Pública', 4),
('Plano Municipal', 4),
('Vila Formosa', 4),
('Cordeiro 2', 4),
('Cordeiro 3', 4),
('Jaguaré', 4),
('Rio de o Campos', 4),
('Sumaré', 4),
('Antonico 1', 4),
('Moinho Velho', 4),
('Praça Portugal', 4),
('Praça São Crispim', 4),
('Cassandoca', 4),
('Tiquatira', 4),
('Decreto', 4),
('D.O.', 4),
('Subprefeituras', 4),
('Secretaria de o Governo Municipal', 4),
('Anhanguera', 3),
('Vila Guilherme', 3),
('Vila prudente', 3),
('Cisco', 3),
('Chefia de Gabinete', 3),
('Assessoria Jurídica', 3),
('Gabinete de o Secretário', 3),
('Parceria Público Privada', 3),
('Parcerias Público Privadas', 3),
('Fazenda', 3),
('Plano', 3),
('Projetos de Lei', 3),
('Criação de o Fundo Municipal de Desenvolvimento Social', 3),
('Alienação de o SPTuris S.A.', 3)]
tokens = nlp(''.join(str(governo_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/governo_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[]
tokens = nlp(''.join(str(habitacao_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/habitacao_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('Sehab', 198),
('Secretaria Municipal de Habitação', 163),
('São Paulo', 136),
('Cohab-SP', 119),
('Haddad', 117),
('José Floriano', 101),
('SEHAB', 101),
('Fernando Haddad', 92),
('Cohab', 88),
('CMH', 83),
('Heliópolis', 72),
('Conselho Municipal de Habitação', 65),
('Programa meu Casa meu Vida', 62),
('Habitação', 61),
('COHAB', 56),
('Governo Federal', 49),
('cidade de São Paulo', 48),
('Prefeitura de São Paulo', 47),
('Caixa Econômica Federal', 47),
('Zona Leste', 44),
('de São Paulo', 41),
('COHAB-SP', 41),
('Secretaria de Habitação', 40),
('Paraisópolis', 40),
('SECOM', 39),
('Programa Mananciais', 39),
('CDHU', 38),
('Ministério de o Cidades', 38),
('Casa meu Vida', 35),
('Plano', 35),
('Plano Municipal de Habitação', 34),
('Secretário Municipal de Habitação', 34),
('prefeitura de São Paulo', 33),
('Habisp', 31),
('Governo', 30),
('SP', 28),
('Jd', 28),
('Programa de Urbanização de Favelas', 27),
('Brasil', 26),
('Comissão Eleitoral', 26),
('Jardim de o Conquista', 25),
('Lei Municipal', 24),
('PMH', 24),
('Centro', 23),
('José Floriano de Azevedo Marques Neto', 23),
('Zona Sul', 22),
('Guarapiranga', 22),
('FMSAI', 22),
('África de o Sul', 21),
('Cidade Tiradentes', 21),
('Habitação de Interesse Social', 20),
('Ipiranga', 20),
('João Whitaker', 20),
('Edifício Martinelli', 19),
('HIS', 19),
('Plano diretor Estratégico', 19),
('INSS', 19),
('Billings', 19),
('Sabesp', 19),
('COPEL', 19),
('União', 18),
('Itaquera', 18),
('Secretaria', 18),
('DIS', 18),
('PDE', 18),
('Casa , meu Vida', 17),
('Durban', 17),
('Programa de Regularização Fundiária', 16),
('Grajaú', 16),
('Conselho', 16),
('Zona Leste de São Paulo', 15),
('São Mateus', 15),
('Secretaria Municipal de o Habitação', 15),
('Geraldo Alckmin', 14),
('Rua São Bento', 14),
('cidade de', 14),
('Jardim Edite', 14),
('Casa Paulista', 14),
('CAIXA', 14),
('Quitação', 14),
('Geraldo Juncal', 14),
('CEF', 13),
('Prefeitura', 13),
('Kassab', 13),
('Reino Unido', 13),
('Caixa', 12),
('Capital', 12),
('Programa de Aceleração de o Crescimento', 12),
('Cidade', 12),
('Jardim Iguatemi', 12),
('IPTU', 12),
('Real Parque', 12),
('Conselho gestor', 12),
('HabisP', 12),
('Fernando de Mello Franco', 11),
('USP', 11),
('Prefeito Fernando Haddad', 11),
('Secom', 11),
('Eletropaulo', 11),
('Pq', 11),
('Mananciais', 11),
('Câmara Municipal', 11),
('Parque de o Gato', 11),
('Funaps', 11),
('IPREM', 11),
('Fundo Municipal de Habitação', 10),
('Governo de o Estado', 10),
('Infraestrutura', 10),
('Desenvolvimento Urbano', 10),
('Pirituba', 10),
('zona Sul', 10),
('Butantã', 10),
('PMSP', 10),
('SMDU', 10),
('Secretário José Floriano', 10),
('Petrobrás', 10),
('Zona Especial de Interesse Social', 10),
('Whitaker', 10),
('Termos de Quitação Definitiva', 10),
('Obras', 9),
('Bom Retiro', 9),
('Nádia Campeão', 9),
('SABESP', 9),
('Rio de Janeiro', 9),
('Sapé', 9),
('Poder Público', 9),
('Cidade Ademar', 9),
('Regularização Fundiária', 9),
('Comissão', 9),
('Fase III', 9),
('Moradia', 9),
('Comunidade de o Ilha', 9),
('Moinho', 9),
('Programa de Metas', 9),
('Viaduto', 9),
('Av. Perimetral', 9),
('Projeto de Lei', 9),
('Fundo de Arrendamento Residencial', 9),
('FAR', 9),
('FDS', 9),
('Jabaquara', 9),
('Diário Oficial de o Cidade', 9),
('Fundo de Atendimento', 9),
('Casa', 8),
('Ponte Baixa', 8),
('M’Boi Mirim', 8),
('Diário Oficial de o Cidade de São Paulo', 8),
('CRAS', 8),
('Secretário Municipal de o Habitação', 8),
('Secretaria Municipal de Desenvolvimento Urbano', 8),
('Cantinho de o Céu', 8),
('Zona Norte', 8),
('Welbedacht', 8),
('Sociedade Civil', 8),
('Sabesp 2', 8),
('Edital', 8),
('Pedreira', 8),
('CEU', 8),
('Cartório de Registro de Imóveis', 8),
('Mariana Belmont', 8),
('Locação Social', 8),
('População moradora', 8),
('Habitação Subnormal', 8),
('Programa de Locação Social', 8),
('Companhia Metropolitana de Habitação', 7),
('Programa', 7),
('Meio Ambiente', 7),
('Parceria Público-Privada', 7),
('Sé', 7),
('Belém', 7),
('Pari', 7),
('Fundo Municipal de Saneamento Ambiental e Infraestrutura', 7),
('Perus', 7),
('UBS', 7),
('Fundo', 7),
('GCM', 7),
('SindusCon-SP', 7),
('estado de São Paulo', 7),
('Renova SP', 7),
('Feirão', 7),
('Campo Limpo', 7),
('Amsterdã', 7),
('Secretário de Habitação', 7),
('Defesa Civil', 7),
('ONGs', 7),
('CET', 7),
('Habisp.plus', 7),
('Gaivotas', 7),
('Comissão Permanente de Licitação', 7),
('Plus', 7),
('Nunzio Briguglio', 7),
('Vila de o Paz', 7),
('Programa meu Casa meu Vida Entidades', 7),
('Regularização', 7),
('Termos de Quitação', 7),
('Jardim Piratininga', 7),
('Habitasampa', 7),
('Companhia de Desenvolvimento Habitacional e Urbano', 6),
('Centro de São Paulo', 6),
('zona Leste', 6)]
tokens = nlp(''.join(str(justica_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/justica_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('PROCON Paulistano', 52),
('Rubens Rizek', 41),
('Bruno Covas', 36),
('São Paulo', 30),
('Procuradoria Geral de o Município', 22),
('Secretaria Municipal de Justiça', 20),
('prefeitura de São Paulo', 20),
('CET', 17),
('GCM', 17),
('Dra', 17),
('de São Paulo', 16),
('Brasil', 16),
('PROCON', 15),
('SP', 15),
('cidade de São Paulo', 14),
('Prefeitura de São Paulo', 14),
('TJSP', 13),
('Município de São Paulo', 13),
('Samu', 13),
('Aberta', 13),
('Paulistano', 11),
('TAC', 11),
('Guarda Civil Metropolitana', 11),
('Polícia Municipal', 11),
('Tribunal de Justiça', 10),
('Secretário Municipal de Justiça', 10),
('SVMA', 10),
('SPTrans', 10),
('Ministério Público', 9),
('FOCCO-SP', 9),
('Município', 9),
('Igreja Universal', 9),
('Defensoria Pública', 8),
('América Latina', 8),
('Companhia de Engenharia de Tráfego', 8),
('Carnaval', 8),
('estado de São Paulo', 8),
('Saída', 8),
('Nubank', 8),
('Procurador Geral', 7),
('Prefeitura', 7),
('PGM', 7),
('STJ', 7),
('IDEC', 7),
('Procon Paulistano', 7),
('Zona Sul', 7),
('Sé', 7),
('Pinheiros', 7),
('Vale de o Anhangabaú', 7),
('Procurador', 7),
('Secretário de Justiça', 7),
('Daniel Annenberg', 7),
('Marginal Pinheiros', 7),
('Procuradoria', 7),
('Mackenzie', 6),
('município de São Paulo', 6),
('Procuradoria Geral de o Município de São Paulo', 6),
('Instituto Brasileiro de Defesa de o Consumidor', 6),
('Estado de São Paulo', 6),
('Ajustamento de Conduta', 6),
('Segurança Urbana', 6),
('Guarda', 6),
('Polícia Militar', 6),
('Código de Defesa de o Consumidor', 6),
('BYD', 6),
('SENACON', 6),
('União', 6),
('Dr. Ricardo Ferrari Nogueira', 6),
('Gustavo Ungaro', 6),
('Procon', 6),
('Semana de o Mobilidade', 6),
('Secretaria de Justiça', 6),
('ABJ', 6),
('Parque Augusta', 6),
('Coordenador de', 5),
('Anderson Pomini', 5),
('Tribunal de Justiça de São Paulo', 5),
('Capital', 5),
('Tribunal', 5),
('Lei Federal', 5),
('Consumidor', 5),
('Prefeituras Regionais', 5),
('Decreto', 5),
('Museu Aeroespacial', 5),
('Caio Megale', 5),
('Centro de Estudos Jurídicos', 5),
('Procons', 5),
('Procurador Geral de o Município', 5),
('Saúde', 5),
('Fazenda', 5),
('Justiça', 5),
('Urbanismo', 5),
('Fiesp', 5),
('Secretaria Especial de Comunicação', 5),
('Adriano Rosetti', 4),
('Departamento Fiscal', 4),
('Lei', 4),
('CGM', 4),
('Meio Ambiente', 4),
('Secretaria', 4),
('Defensoria Pública de o Estado de São Paulo', 4),
('Idec', 4),
('Poder Judiciário', 4),
('Avenida 23 de Maio', 4),
('Zona Oeste', 4),
('Vila Mariana', 4),
('Carnaval de Rua', 4),
('Rua de o Consolação', 4),
('Secretário Nacional de o Consumidor', 4),
('Dr. Arthur Rollo', 4),
('Coordenadoria de Defesa de o Consumidor', 4),
('Segunda-feira de Carnaval', 4),
('Campo de Marte', 4),
('Parque', 4),
('Governo Federal', 4),
('Verde e Meio Ambiente', 4),
('PPMI', 4),
('Projeto', 4),
('Superior Tribunal de Justiça', 4),
('Projeto de Lei', 4),
('PL', 4),
('Educação', 4),
('Cohab-SP', 4),
('Fundação Getúlio Vargas', 4),
('Manoel de Queiroz Pereira Calças', 4),
('Guilherme Bueno de Camargo', 4),
('Judiciário', 4),
('Guilherme Bueno', 4),
('Embaixador Affonso Massot', 4),
('Nossa Senhora Aparecida', 4),
('Fechada', 4),
('Barra Funda', 4),
('Inovação e Tecnologia', 4),
('João Octaviano', 4),
('Obras', 4),
('Direitos Humanos e Cidadania', 4),
('TRF3', 4),
('BYD Brasil', 4),
('Direito Administrativo', 4),
('Procuradora', 4),
('Cohab', 4),
('CEJUSC', 4),
('Palmeiras', 4),
('Conduapp', 4),
('Hackatona', 4),
('Shawee', 4),
('Poder Público', 3),
('IPTU', 3),
('ITBI', 3),
('CGM-SP', 3),
('2º Mutirão Digital de Renegociação de dívida e Educação Financeira de o Município de São Paulo',
3),
('Federação Brasileira de Bancos', 3),
('Associação Brasileira', 3),
('ABECS', 3),
('Rua Boa Vista', 3),
('Centro', 3),
('Centro de São Paulo', 3),
('City Câmeras', 3),
('Licenciamento', 3),
('Procuradoria Geral', 3),
('novo Avanços e Desafios', 3),
('Câmara Municipal de São Paulo', 3),
('José Roberto Rodrigues de Oliveira', 3),
('Supremo Tribunal Federal', 3),
('País', 3),
('Guardas', 3),
('Câmara Municipal', 3),
('Febraban', 3),
('João Doria', 3),
('Carnaval de Rua de São Paulo', 3),
('Cidade', 3),
('Anhembi', 3),
('Secretaria Municipal de Assistência e Desenvolvimento Social', 3),
('SMADS', 3),
('Domingo de Carnaval', 3),
('Conselho Municipal de Preservação de o Patrimônio Histórico , Cultural e Ambiental de o Cidade de São Paulo',
3),
('CDC', 3),
('Iprem', 3),
('Fipe', 3),
('Fundação Instituto de Pesquisas Econômicas', 3),
('Súmula', 3),
('Tribunais', 3),
('Colégio', 3),
('Cejur', 3),
('Teatro Cásper Líbero', 3),
('Palestrante', 3),
('Ione Amorim', 3),
('FGV', 3),
('Instituto Alana', 3),
('Rubens Rizek Jr.', 3),
('USP', 3),
('Corregedoria Geral de o Administração', 3),
('Faculdade de Direito de o Universidade de São Paulo', 3),
('Ministério Público Estadual', 3),
('Controlador Geral de o Município', 3),
('Procuradoria Geral de o Estado', 3),
('Comunicação Social TJSP', 3),
('Município Amigo de o Justiça', 3),
('Santos', 3),
('Theatro Municipal', 3)]
tokens = nlp(''.join(str(justica_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/justica_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('Jurídicos', 9),
('Procon Paulistano', 9),
('Secretaria Municipal', 7),
('Decreto', 6),
('Conselho Municipal de Defesa de o Consumidor', 6),
('Procuradoria Geral de o Município', 6),
('Dia Internacional de o Mulheres', 4),
('PGM', 4),
('PROCON', 2),
('Paulistano', 2),
('SNJ', 2),
('CONDECON Paulistano', 2),
('Diário Oficial', 2),
('Projeto de Lei de Combate a o Assédio sexual em o Administração Pública',
2),
('PL', 2),
('Prefeitura', 2),
('Câmara de o Deputados de Projeto de Lei', 2),
('Combate a o Assédio sexual em o Administração Pública', 2),
('Secretaria Municipal de Políticas para o Mulheres', 2),
('Secretaria Municipal de Gestão', 2),
('Projeto', 2),
('Projeto de Lei', 2),
('Administração Pública', 2),
('Fernando Haddad', 2),
('Haddad', 2),
('Denise Motta Dau', 2),
('Políticas para o Mulheres', 2),
('Secretaria de negócio Jurídicos', 2),
('cidade de São Paulo', 2),
('Isabel Kauz', 2),
('União Geral de o Trabalhadores', 2),
('Junéia Batista', 2),
('Secretaria de o Mulher Trabalhadora de o Central Única de o Trabalhadores',
2),
('Organização Internacional de o Trabalho', 2),
('Brasil', 2),
('Nádia Campeão', 2),
('Artur Henrique', 2),
('Desenvolvimento , Trabalho e Empreendedorismo', 2),
('Robinson Barreirinhas', 2),
('José Américo', 2),
('Relações Governamentais', 2),
('Lei', 2),
('PROCON Carioca', 2),
('São Paulo', 2),
('Superior Tribunal de Justiça', 2),
('Rádio Mega Brasil Online', 2),
('Angela Crespo', 2),
('Procon', 2),
('Procon paulistano', 2),
('Organização de o Sistema Municipal de Defesa de o Consumidor', 1),
('Prefeitura Municipal de São Paulo', 1),
('CONSULTA Pública', 1),
('Sistema Municipal de Defesa de o Consumidor', 1),
('SMDC', 1),
('Departamento de Defesa de o Consumidor', 1),
('Fundo Municipal de Defesa de o Consumidor', 1),
('FMDC', 1),
('Lei Federal', 1),
('Lei de Acesso a o Informação', 1),
('Pública', 1),
('CPF', 1),
('I de o Lei Federal', 1),
('Prefeito Fernando Haddad', 1),
('Secretário de negócio Jurídicos Robinson Barreirinhas', 1),
('Prefeito Haddad', 1),
('Associação Brasileira de o Procons', 1),
('Nacional de o Consumidor', 1),
('Ministério de o Justiça', 1),
('Juliana Pereira de o Silva', 1),
('Cooperação técnico', 1),
('Grupo de Trabalho de SNJ', 1),
('Mutirão de Conciliação de o PROCON Carioca/2016', 1),
('Rio de Janeiro', 1),
('Conselho Municipal de Defesa de o Consumidor Edital', 1),
('Conselheiros para', 1),
('I', 1),
('Poder Público Municipal', 1),
('Ordem de o Advogados de o Brasil', 1),
('Programa de Metas 2013-2016', 1),
('2º Turma', 1),
('Controladoria', 1),
('Ministério Público', 1),
('RSSthabite', 1),
('CGM', 1),
('Departamento de Procedimentos Disciplinares', 1),
('Diário de o Justiça Eletrônico', 1),
('Ricardo Ferrari Nogueira', 1),
('Direito e Defesa de o Consumidor', 1),
('Ricardo', 1),
('Sistema Nacional de Defesa de o Consumidor', 1),
('Divisão de Estudos', 1),
('Pesquisas e Educação', 1),
('Consumidor e Fornecedor', 1),
('Divisão de Atendimento', 1),
('Consumidor', 1),
('Divisão de Fiscalização', 1),
('Divisão de Termos de Ajustamento de Conduta e Ações Coletivas', 1),
('plataforma Consumidor', 1),
('Governo Federal', 1),
('CONDECON', 1),
('Conselho', 1),
('Procuradoria Geral', 1),
('Diário Oficial de o Município', 1),
('Fazenda Municipal', 1),
('Tribunal', 1),
('Município', 1),
('Serviço de Informação Jurídica', 1),
('Cidadão', 1),
('Órgãos de Execução :', 1),
('Robinson Sakiyama', 1),
('Matarazzo', 1),
('Telefone', 1)]
tokens = nlp(''.join(str(meio_ambiente_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/meio_ambiente_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('SVMA', 961),
('Meio Ambiente', 936),
('Secretaria Municipal de o Verde', 606),
('Parque Ibirapuera', 529),
('UMAPAZ', 290),
('São Paulo', 273),
('Secretaria de o Verde', 206),
('Parque de o Carmo', 159),
('Ibirapuera', 159),
('Brasil', 136),
('cidade de São Paulo', 131),
('Av. Pedro Álvares Cabral', 123),
('Portão', 122),
('Endereço', 119),
('Parque Ibirapuera Data', 104),
('Horário', 100),
('Parque Jardim de o Luz', 97),
('Parque Trianon', 95),
('Mata Atlântica', 93),
('de São Paulo', 86),
('Guarapiranga', 83),
('Parques', 80),
('Jd', 80),
('Trianon', 79),
('Itaquera', 79),
('Pedro Álvares Cabral', 75),
('Parque Independência', 70),
('Parque de o Povo', 70),
('Praça de o Luz', 68),
('Av. Paulista', 66),
('Verde', 60),
('Avenida Pedro Álvares Cabral', 60),
('Auditório Ibirapuera', 58),
('Parque', 57),
('Teatro', 57),
('Parque Guarapiranga', 54),
('Wanderley Meira de o Nascimento', 53),
('DGD', 52),
('Universidade Aberta de o Meio Ambiente e Cultura de Paz', 52),
('Parque Santo Dias', 52),
('Vila Mariana', 51),
('Bom Retiro', 51),
('Parque Buenos Aires', 50),
('Marquise', 49),
('Parque de o Ibirapuera', 48),
('Clique', 48),
('Prefeitura de São Paulo', 47),
('Butantã', 47),
('Jardim de o Luz', 46),
('Divisão de Fauna', 45),
('Carmo', 45),
('Endereço :', 45),
('Ibira', 43),
('Centro', 40),
('Parque Tenente Siqueira Campos', 40),
('Rua Peixoto Gomide', 40),
('Ipiranga', 40),
('Parque Anhanguera', 40),
('Aclimação', 39),
('GCM', 39),
('Avenida Paulista', 38),
('Av. Afonso de Sampaio e Souza', 37),
('Cades', 35),
('Parque Ibirapuera Endereço', 35),
('Rua Breves', 35),
('Joca Duarte', 35),
('Conselho', 34),
('Parque Severo Gomes', 34),
('Parque Alfredo Volpi', 33),
('Pinheiros', 32),
('Secretaria Municipal de o Verde e Meio Ambiente', 32),
('Parelheiros', 32),
('Ricardo Teixeira', 31),
('Parque Benemérito José Brás', 31),
('Chácara Monte Alegre', 31),
('Parque de o Trote', 31),
('Altura', 29),
('Parque Rodrigo de Gásperi', 29),
('Parque Aclimação', 29),
('Parque Cordeiro', 29),
('PMMA', 29),
('Trote', 28),
('Pirituba', 28),
('Guarda Civil Metropolitana', 28),
('Buenos Aires', 27),
('Wanderley Meira', 27),
('Parque Mário Covas', 27),
('Romildo Campello', 27),
('Escola Municipal de Jardinagem', 26),
('Portão 10', 26),
('Parque Trianon Data', 26),
('Rodrigo Ravena', 26),
('Independência', 25),
('Cultura de Paz', 25),
('Parque Raposo Tavares', 25),
('Rua Muniz de Souza', 25),
('Auditório', 25),
('Nádia Campeão', 25),
('Parque Cemucam', 25),
('Palestra', 24),
('Mário Covas', 24),
('Escola Municipal de Astrofísica', 24),
('Parque Barragem de o Guarapiranga', 24),
('Departamento de Gestão Descentralizada', 24),
('Parque Previdência', 24),
('Portão I', 24),
('Universidade Aberta de o Meio Ambiente', 23),
('Avenida Angélica', 23),
('Parque de o Luz', 23),
('Higienópolis', 23),
('Fernando Haddad', 23),
('Parque Jardim de o Luz Data', 23),
('Vila Guilherme', 23),
('Portão II', 23),
('Capão Redondo', 23),
('Parque de o Carmo Data', 23),
('parque Ibirapuera', 23),
('SP', 22),
('Vila prudente', 22),
('Parque Vila Guilherme', 22),
('Rua Nadir Dias Figueiredo', 22),
('Parque ’', 22),
('Feira de Economia Solidária', 22),
('Bairro', 21),
('MAM', 21),
('Rua Pires de Oliveira', 21),
('Parque Alves de Lima', 21),
('Jaraguá', 21),
('Parque de o Cordeiro', 21),
('Natal', 21),
('Bosque de o Leitura', 21),
('Sul', 20),
('Plano', 20),
('Tucuruvi', 20),
('Educação Ambiental', 20),
('Parque Linear Rio Verde', 20),
('Lian Gong', 20),
('Campo Limpo', 20),
('Rua Mesopotâmia', 20),
('Virada Sustentável', 20),
('José Tadeu Candelária', 20),
('Horário : domingo', 20),
('cidade de', 19),
('prefeitura de São Paulo', 19),
('Conselho Municipal de o Meio Ambiente e Desenvolvimento Sustentável', 19),
('PGIRS', 19),
('Cidade de São Paulo', 19),
('Av. Nazareth', 19),
('Zona Leste', 19),
('Japão', 19),
('Parque Raul Seixas', 19),
('Rua Alcindo Bueno de Assis', 19),
('Cidade Tiradentes', 19),
('Capital', 19),
('Wanderley', 19),
('Santo Amaro', 19),
('Parque Jardim Herculano', 19),
('Projeto Teatro', 19),
('PDE', 19),
('Escola de Jardinagem', 18),
('Parque Barragem de Guarapiranga', 18),
('São Mateus', 18),
('Telefone', 18),
('Rodovia Raposo Tavares', 18),
('Cotia', 18),
('Rua Arroio', 18),
('Cemucam', 18),
('Tai Chi Chuan', 18),
('Parque Prefeito Mário Covas', 18),
('Domingo', 18),
('Data', 18),
('Tai Chi Pai Lin', 18),
('Plano Municipal de Conservação e Recuperação de o Mata Atlântica', 18),
('Grajaú', 17),
('Cia', 17),
('Rua de o Paraíso', 17),
('Observação de Aves', 17),
('Arena de Eventos', 17),
('Raposo Tavares', 17),
('Secretário Municipal de o Verde', 17),
('Anhanguera', 17),
('Virada Cultural', 17),
('Lei', 17),
('Plateia Externa', 17),
('USP', 17),
('Parques 2015', 17),
('Oficina', 16),
('parque Trianon', 16),
('Ermelino Matarazzo', 16),
('Crsans', 16),
('Secretaria Municipal de Cultura', 16),
('UNIFESP', 16),
('Mogi de o Cruzes', 16),
('Uninove', 16),
('Simão Pedro', 16),
('Município de São Paulo', 16),
('Lazer e Recreação', 16),
('Parque Lions Clube', 16),
('Itaim Paulista', 16),
('Guarulhos', 16)]
tokens = nlp(''.join(str(obras_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/obras_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('CGE', 214),
('Obras', 132),
('Bruno Covas', 117),
('Vitor Aly', 105),
('São Paulo', 101),
('Gabinete de o Secretário', 76),
('Secretaria Especial de Comunicação', 75),
('reunião Interna', 71),
('Secretário de Infraestrutura Urbana', 70),
('Zona Sul', 69),
('Prefeitura de São Paulo', 63),
('Gabinete', 62),
('Marginal Pinheiros', 54),
('SIURB', 54),
('Zona Leste', 50),
('Viaduto de o Chá', 49),
('Capital', 41),
('CET', 38),
('UBS', 38),
('Zona Norte', 37),
('Secretário', 33),
('C', 31),
('Cidade', 29),
('Sra', 27),
('Centro de Gerenciamento de Emergências', 26),
('ZL', 26),
('Parelheiros', 25),
('prefeitura de São Paulo', 24),
('Infraestrutura Urbana', 24),
('Edson Aparecido', 24),
('Educação Infantil', 23),
('Grande São Paulo', 22),
('ZO', 22),
('Regina', 22),
('Ipiranga', 21),
('Thomaz Garcia', 20),
('Capela de o Socorro', 20),
('Michael Pantera', 19),
('°C', 19),
('de São Paulo', 19),
('ZS', 19),
('Córrego Aricanduva', 19),
('Secretaria Municipal de Infraestrutura Urbana', 19),
('Prefeito Bruno Covas', 19),
('cidade de São Paulo', 18),
('Descomplica SP', 18),
('Jabaquara', 17),
('SP', 17),
('Secretário Quinta-feira', 17),
('Ata', 17),
('Brasil', 16),
('SPObras', 16),
('Vila prudente', 16),
('Governo Federal', 16),
('Adilson Nazário', 15),
('Nazário', 15),
('Pantera', 15),
('Zona Oeste', 15),
('Capital paulista', 15),
('Marcos Penido', 15),
('Campo Limpo', 15),
('EMEI', 15),
('São Miguel Paulista', 15),
('Secretário Segunda-feira', 15),
('Secretário Sexta-feira', 15),
('Centro de Gerenciamento de Emergências de o Prefeitura de São Paulo', 14),
('Garcia', 14),
('São Mateus', 14),
('Ministério de o Cidades', 14),
('SÃO Paulo', 14),
('João Doria', 14),
('CPTM', 14),
('Centro de Educação Infantil', 14),
('TCM', 14),
('Edital', 14),
('Butantã', 13),
('Centro', 13),
('La Niña', 13),
('Marginal', 13),
('Saúde Bucal', 13),
('Externa', 13),
('Audiência Pública', 13),
('Cidade Ademar', 12),
('estado de São Paulo', 12),
('EDIF', 12),
('Interlagos', 12),
('Alexandre Schneider', 12),
('Ponte de o Casa Verde', 12),
('Interna', 12),
('Vila Mariana', 11),
('Prefeitura', 11),
('R3', 11),
('Córrego Tremembé', 11),
('CEIs', 11),
('OAE', 11),
('Cidade Tiradentes', 10),
('Defesa Civil', 10),
('Diário Oficial', 10),
('SPTrans', 10),
('Pirituba', 10),
('Cidade Líder', 10),
('Estratégia Saúde de o Família', 10),
('Rua José Paulino', 10),
('Ponte de o Freguesia de o ó', 10),
('Pinheiros', 9),
('Cidade de São Paulo', 9),
('Perus', 9),
('União', 9),
('Sudeste', 9),
('Avenida Washington Luís', 9),
('Centro de Gerenciamento de Emergências Climáticas', 9),
('Marginal Tietê', 9),
('ACS', 9),
('Siurb', 9),
('Dutra', 9),
('Tremembé', 8),
('Penha', 8),
('Sul', 8),
('Itaim Paulista', 8),
('Congonhas', 8),
('USP', 8),
('Governo', 8),
('Aricanduva', 8),
('Avenida de o Bandeirantes', 8),
('R6', 8),
('Prefeituras Regionais', 8),
('Centro de Gerenciamento de Emergências Climáticas de o Prefeitura de São Paulo',
8),
('Tribunal', 8),
('Unidade Básica de Saúde', 8),
('Rede Municipal de Ensino', 8),
('CEMEI', 8),
('Secretaria Municipal de Infraestrutura', 8),
('Castello Branco', 8),
('Av. Prof', 8),
('Rua São Bento', 8),
('Oeste', 7),
('El Niño', 7),
('Freguesia de o ó', 7),
('Imprensa', 7),
('Manoel Rodrigues Santiago', 7),
('Córrego de o Cordeiro', 7),
('ZN', 7),
('Centros de Educação Infantil', 7),
('Covas', 7),
('Castelo Branco', 7),
('OAEs', 7),
('UPA', 7),
('sr. Geraldo', 7),
('Zona de Convergência de o Atlântico Sul', 6),
('ZCAS', 6),
('Lapa', 6),
('Secretaria Municipal de Habitação', 6),
('Fernando Chucre', 6),
('Thomaz', 6),
('córrego Ipiranga', 6),
('Programa de redução de Alagamentos', 6),
('Caixa Econômica Federal', 6),
('Avenida de o Estado', 6),
('Companhia de Engenharia de Tráfego', 6),
('Cambuci', 6),
('Berçário 1', 6),
('Minigrupos 1', 6),
('Associação de o Amigos', 6),
('Zona Sul de São Paulo', 6),
('R7', 6),
('R8', 6),
('Marginal de Pinheiros', 6),
('Parque de o Chuvisco', 6),
('Jaraguá', 6),
('EMEIs', 6),
('Secretaria Municipal', 6),
('Fazenda', 6),
('Edifício Othon', 6),
('Mobilidade e Transportes', 6),
('Secretaria Municipal de Assistência e Desenvolvimento Social', 6),
('Município', 6),
('Associação Paulista', 6),
('Secretaria de Infraestrutura Urbana', 6),
('Secretaria Municipal de Cultura', 6),
('Turismo', 6),
('Núcleo de Apoio a o Saúde de o Família', 6),
('Fábrica de o Samba', 6),
('Cemeis', 6),
('Casa Verde', 6),
('Ministério Público', 6),
('Ascendino Reis', 6),
('Diretora', 6),
('Jaçanã', 5),
('Mooca', 5),
('Norte', 5),
('SMSO', 5),
('Imprensa CGE', 5),
('Serviços e Obras', 5),
('Campo de Marte', 5),
('Programa meu Casa meu Vida', 5),
('FAR', 5),
('Brasilândia', 5),
('BANDNEWS FM', 5),
('Mata Atlântica', 5),
('Vivo', 5)]
tokens = nlp(''.join(str(obras_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/obras_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('SIURB', 326),
('SPObras', 227),
('Despachos Internos SIURB', 226),
('Secretário', 145),
('Obras', 123),
('Despachos Internos SPObras', 122),
('Despachos', 96),
('Secretaria de Infraestrutura Urbana', 75),
('São Paulo', 67),
('Roberto Garibe', 66),
('Secretário Segunda-feira', 64),
('Secretário Sexta-feira', 62),
('SGM', 59),
('Secretário Quinta-feira', 57),
('Aricanduva', 55),
('Despachos Internos', 55),
('córrego Cordeiro', 55),
('CGE', 55),
('Fernando Haddad', 53),
('Maria Regina Nogueira', 51),
('Parelheiros', 48),
('SMSO', 46),
('Siurb', 43),
('Cordeiro', 41),
('Gabinete de o Prefeito', 39),
('EDIF', 39),
('prefeitura de São Paulo', 37),
('Tremembé', 34),
('EMEI', 33),
('RCO', 32),
('Campo Limpo', 31),
('SPOBRAS', 30),
('Departamento de Edificações', 30),
('Despachos interno SIURB', 28),
('Ponte Baixa', 26),
('Prefeitura de São Paulo', 26),
('cidade de São Paulo', 26),
('Corpo Técnico de SIURB', 25),
('UPA', 25),
('Mtb', 25),
('Ipiranga', 24),
('Itaquera', 23),
('Zona Sul', 23),
('PRA', 22),
('CEU', 22),
('Itaim Paulista', 21),
('SP', 20),
('M’Boi Mirim', 20),
('Santo Amaro', 20),
('CEUs', 19),
('Programa de redução de Alagamentos', 19),
('Butantã', 19),
('Flickr', 18),
('Zona Leste', 18),
('Osvaldo Misso', 18),
('Prefeito', 17),
('Capela de o Socorro', 17),
('Brasilândia', 17),
('São Miguel Paulista', 17),
('Metrô', 16),
('Prefeita', 16),
('UBSs', 16),
('Assessoria de Imprensa', 16),
('Haddad', 15),
('Guarulhos', 15),
('SEHAB', 15),
('SMDU', 15),
('Zavuvus', 15),
('Hospital Parelheiros', 15),
('Convias', 14),
('UAB', 14),
('SNJ', 14),
('Cidade Ademar', 14),
('Audiência Pública', 13),
('Capão Redondo', 13),
('CET', 13),
('Ricardo Rezende', 13),
('Plano', 13),
('Jabaquara', 13),
('Ribeirão Perus', 13),
('córrego Paciência', 13),
('Jornalista Mtb', 13),
('Mooca', 13),
('Governo', 12),
('Éguas', 12),
('Infraestrutura Urbana', 12),
('Córrego Cordeiro', 12),
('Cidade', 12),
('Universidade Aberta de o Brasil', 12),
('SF', 12),
('Gasômetro', 12),
('Programa de Aceleração de o Crescimento', 12),
('OGU', 12),
('Hospital Brasilândia', 12),
('Escola Municipal de Educação Infantil', 12),
('Sexta-feira', 11),
('Técnica', 11),
('Secretaria Municipal de Serviços e Obras', 11),
('SMT', 11),
('RDC', 11),
('Brasil', 11),
('Penha', 11),
('Secretário Terça Feira', 11),
('Secretário Quinta Feira', 11),
('Secretário de Infraestrutura Urbana', 11),
('Governo Federal', 11),
('Tucuruvi', 11),
('Jaçanã', 11),
('Taboão', 11),
('Unidades Básicas de Saúde', 11),
('Bairro', 11),
('Irene Beatriz', 11),
('CEMEI Jardim Jaqueline', 11),
('de São Paulo', 10),
('SME', 10),
('Corpo Técnico de SPObras', 10),
('SVMA', 10),
('Hospital de Parelheiros', 10),
('Secretário Quarta Feira', 10),
('Segunda feira', 10),
('Ermelino Matarazzo', 10),
('Santana', 10),
('Paraguai', 10),
('Parque de o Carmo', 10),
('UPAs', 10),
('Capital', 10),
('Praça Comunitária Lígia Maria Salgado Nóbrega', 10),
('Despachos Internos SIURB 14h30', 10),
('PMSP', 10),
('Secom', 10),
('Centro de Gerenciamento de Emergências', 10),
('Jockey', 10),
('Ilume', 10),
('Prefeito Fernando Haddad', 9),
('Pirituba', 9),
('Vila Mariana', 9),
('Marginal Tietê', 9),
('Secretário Sexta Feira', 9),
('Urbana', 9),
('Radial Leste', 9),
('Guarapiranga', 9),
('CEMEI', 9),
('Garibe', 9),
('GabineteAberto', 9),
('PRA 1', 9),
('Osmar Dias de o Santos', 9),
('UBS', 9),
('Centro de Educação Infantil', 9),
('CEIs', 9),
('Érika Kwiek', 9),
('IFSP', 9),
('Maiara Torres', 9),
('El Niño', 9),
('Córrego Zavuvus', 8),
('córrego Paraguai', 8),
('Osvaldo Spuri', 8),
('Quinta-feira', 8),
('Secretaria Municipal de Educação', 8),
('Nádia Campeão', 8),
('Maria Regina Nogueira Jornalista Mtb', 8),
('Despachos Internos SIURB 15:00h', 8),
('Água Preta', 8),
('Simão Pedro', 8),
('São Mateus', 8),
('Unidade de Pronto Atendimento', 8),
('córrego Itaim', 8),
('Jardim Itacolomi', 8),
('Vila prudente', 8),
('RCO-03', 8),
('Freitas', 8),
('Mtb 19.271', 8),
('Centro de Gerenciamento de Emergências de o Prefeitura de São Paulo', 8),
('Chácara de o Jockey', 8),
('Thomaz Garcia', 8),
('Aclimação', 8),
('Viaduto Santo Amaro', 7),
('CEC', 7),
('EMEF', 7),
('Educação', 7),
('Secretário Quinta', 7),
('cidade de', 7),
('Despachos Internos SIURB 15h30', 7),
('córrego Ipiranga', 7),
('Diário Oficial', 7),
('córrego Freitas', 7),
('SPObras 14:30h', 7),
('Educação Infantil', 7),
('Gabinete de', 7),
('Youtube', 7),
('São Paulo Aberta', 7),
('estrada de Itapecerica', 7),
('Subprefeituras de o Jabaquara', 7),
('Pedro Algodoal', 7),
('Ponte de o Piqueri', 7),
('Centro', 7),
('Raposo Tavares', 7),
('Jardim Ângela', 7),
('Av. Durval Pinto Ferreira', 7),
('Jd', 7),
('Itacolomi', 7)]
tokens = nlp(''.join(str(pessoa_com_deficiencia_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/pessoa_com_deficiencia_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('SMPED', 728),
('Cid Torquato', 272),
('Secretaria Municipal de o Pessoa com Deficiência', 259),
('São Paulo', 240),
('Libras', 204),
('CATe', 202),
('Secretário Cid Torquato', 190),
('Secretária Adjunta Marinalva Cruz', 151),
('Brasil', 146),
('prefeitura de São Paulo', 135),
('Chefe de Gabinete', 130),
('Secretário Municipal', 126),
('SP', 110),
('Despachos Internos', 102),
('Prefeitura de São Paulo', 90),
('Centro', 84),
('CMPD', 79),
('cidade de São Paulo', 75),
('Comissão Permanente de Acessibilidade', 75),
('Selo de Acessibilidade', 72),
('CPA', 70),
('Flavio Adauto Fenólio', 69),
('RG', 67),
('Viaduto de o Chá', 63),
('Centro de Apoio a o Trabalho e Empreendedorismo', 60),
('o Pessoa', 59),
('de São Paulo', 58),
('Secretaria Municipal de o Trabalho e Empreendedorismo', 53),
('Pessoa com Deficiência', 53),
('Conselho Municipal de o Pessoa com Deficiência', 52),
('Língua Brasileira de Sinais', 48),
('Secretária Adjunta Marinalva Cruz Quinta-feira', 48),
('Marinalva Cruz', 47),
('Secretária Adjunta Marinalva Cruz Sexta-feira', 45),
('Secretária Adjunta Marinalva Cruz Segunda-feira', 44),
('CIL', 43),
('Secretário Cid Torquato Sexta-feira', 43),
('Lei Brasileira de Inclusão', 39),
('Rua Líbero Badaró', 39),
('ContrataSP', 39),
('Pessoa', 37),
('Secretário Cid Torquato Segunda-feira', 36),
('CIEE', 35),
('Viaduto Jacareí', 33),
('Selo de Acessibilidade Digital', 33),
('PDF', 32),
('SMTE', 32),
('Secretário Cid Torquato Quinta-feira', 32),
('Silvana Cambiaghi', 29),
('CET', 29),
('Lei de Cotas', 29),
('IBGE', 28),
('Câmara Municipal de São Paulo', 28),
('Av. São João', 28),
('Central de Atendimento', 27),
('Biblioteca Mário de Andrade', 27),
('LBI', 26),
('INSS', 26),
('DSV', 26),
('Munícipe', 25),
('Bruno Covas', 25),
('Rodovia de o Imigrantes', 25),
('CPB', 24),
('ABNT', 24),
('Barra Funda', 24),
('Dra', 24),
('CMSP', 24),
('Flavio Adauto Fenólio Quinta-feira', 24),
('Avenida Paulista', 23),
('Paralímpico Brasileiro', 23),
('SPTrans', 23),
('Santo Amaro', 23),
('Secretário Cid Torquato Domingo', 23),
('Vale de o Anhangabaú', 22),
('Centro Cultural São Paulo', 22),
('Priscila Fonseca', 22),
('PMSP', 22),
('Cultura Inclusiva', 22),
('Parque de o Ibirapuera', 21),
('Rua Boa Vista', 21),
('Secretaria Municipal de o Pessoa com Deficiência de São Paulo', 21),
('Palestra', 21),
('AACD', 21),
('Secretaria', 20),
('Parque Ibirapuera', 20),
('Pinheiros', 20),
('CMPD-SP', 20),
('Decreto', 20),
('SMIT', 20),
('Itaquera', 20),
('Atende+', 20),
('Secretaria Municipal de Cultura', 19),
('Lapa', 19),
('SMADS', 19),
('Av. Paulista', 19),
('Gabinete', 19),
('Mooca', 19),
('Zona Leste', 19),
('Flavio Adauto Fenólio Sexta-feira', 19),
('USP', 18),
('Anhembi', 18),
('Samba com o Mãos', 18),
('Selo', 18),
('Vila Mariana', 18),
('Ipiranga', 18),
('Centro de Apoio de o Trabalho e Empreendedorismo', 17),
('Rua de o Consolação', 17),
('Ibirapuera', 17),
('estado de São Paulo', 17),
('Adjunta Marinalva Cruz', 17),
('Rua Vergueiro', 17),
('LIBRAS', 17),
('Campo Limpo', 17),
('Chefe de Gabinete Flavio Fenólio', 17),
('SMC', 17),
('Flavio Adauto', 17),
('Edifício Matarazzo', 16),
('SMG', 16),
('Contrata SP', 16),
('Braille', 16),
('Rosa', 16),
('Prefeito Bruno Covas', 16),
('TCM', 16),
('Selo de Acessibilidade Arquitetônica', 16),
('Censo', 15),
('Secretaria de Estado de o Direitos de o Pessoa com Deficiência', 15),
('ONU', 15),
('Secretaria de o Pessoa com Deficiência', 15),
('Encontro Paulistano de Pessoas com Deficiência', 15),
('Cid Torquato Domingo', 15),
('Mutirão Mario Covas', 15),
('W3C', 15),
('SMT', 15),
('Fábio Nunes', 15),
('CAU', 15),
('Secretarias', 14),
('Programa de Metas', 14),
('Santos', 14),
('Brenda Marques', 14),
('Tatuapé', 14),
('Secretaria Municipal de Trabalho e Empreendedorismo', 14),
('Áustria', 14),
('Dell', 14),
('Zona Sul', 14),
('CEUs', 14),
('SEME', 14),
('Central de Intermediação', 14),
('Subprefeituras', 14),
('PIS', 13),
('Consolação', 13),
('World Summit Award', 13),
('Virada Cultural', 13),
('Down', 13),
('SMDHC', 13),
('Santana', 13),
('Acessibilidade', 13),
('Portão', 13),
('Prefeituras Regionais', 12),
('Trabalho e Empreendedorismo', 12),
('São Miguel Paulista', 12),
('Norma Brasileira de Acessibilidade a Edificações , Mobiliário , Espaços e Equipamentos Urbanos',
12),
('Idoso', 12),
('Digitalks', 12),
('Gabinete de o Prefeito', 12),
('Flavio Fenólio', 12),
('Lei', 12),
('SHOPPING', 12),
('Campo de Marte', 12),
('Flavio Adauto Fenólio Segunda-feira', 12),
('Português', 12),
('Tradução para Libras', 12),
('João Doria', 11),
('Biblioteca Mario de Andrade', 11),
('Transamérica Expo Center', 11),
('Zona Norte', 11),
('Encontro', 11),
('Praça de o Artes', 11),
('SME', 11),
('Rua Martins', 11),
('Instituto Tomie Ohtake', 11),
('SUS', 11),
('SMPR', 11),
('Chefe', 11),
('PROCON Paulistano', 11),
('Central de Intermediação em Libras', 11),
('Deficiência', 10),
('André Sturm', 10),
('Zona Oeste', 10),
('Carteira de Trabalho', 10),
('Argentina', 10),
('Facebook', 10),
('ABNT NBR', 10),
('Ministério Público', 10),
('Premiação Global WSA', 10),
('Aline Cardoso', 10),
('CCSP', 10),
('Bike Tour SP', 10),
('Rua Tabapuã', 10),
('Assistência Social', 10),
('Av. Professor Ascendino Reis', 10)]
tokens = nlp(''.join(str(pessoa_com_deficiencia_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/pessoa_com_deficiencia_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('Despachos Internos', 671),
('Marianne Pinotti', 477),
('SMPED', 339),
('Secretário Adjunto', 284),
('São Paulo', 213),
('Libras', 175),
('Secretaria Municipal de o Pessoa com Deficiência', 154),
('Mobilidade Reduzida', 150),
('SDTE', 137),
('Secretaria Municipal de o Desenvolvimento , Trabalho e Empreendedorismo',
125),
('Brasil', 97),
('Tuca Munhoz', 94),
('cidade de São Paulo', 91),
('Rua Líbero Badaró', 91),
('RG', 90),
('Bairro', 90),
('CATe', 85),
('Munícipe', 83),
('Pessoa com Deficiência', 80),
('Central de Atendimento', 80),
('CIL', 73),
('Fernando Haddad', 66),
('Dudu Braga', 62),
('prefeitura de São Paulo', 57),
('Secretária', 57),
('Sra', 55),
('Secretaria Municipal de o Pessoa com Deficiência e Mobilidade Reduzida',
54),
('Prefeitura de São Paulo', 53),
('CMPD', 52),
('Marianne Pinotti Segunda-feira', 52),
('CPA', 51),
('Centro de Apoio a o Trabalho e Empreendedorismo', 51),
('Marianne Pinotti Quinta-feira', 50),
('Comissão Permanente de Acessibilidade', 49),
('de São Paulo', 49),
('SP', 48),
('Centro de Apoio a o Trabalho', 47),
('Feira', 46),
('Língua Brasileira de Sinais', 45),
('Dra', 43),
('Gabinete', 43),
('Despachos Internos SMPED', 43),
('Marianne Pinotti Sexta-feira', 42),
('Conselho Municipal de o Pessoa com Deficiência', 41),
('Plano São Paulo', 41),
('Deficiência', 40),
('Sala de Reuniões', 40),
('Prefeitura', 39),
('Virada Cultural', 39),
('Lei de Cotas', 38),
('Brasília', 37),
('Down', 37),
('Assinaturas', 37),
('Marianne', 36),
('Haddad', 33),
('Central de Interpretação de Libras', 33),
('Itaquera', 32),
('USP', 32),
('Centro', 32),
('Despachos', 32),
('o Pessoa com Deficiência', 31),
('Nádia Campeão', 31),
('Selo de Acessibilidade', 29),
('Prefeito', 28),
('Av. São João', 28),
('Inclusiva', 28),
('FIESP', 27),
('Empreendedorismo', 27),
('Anhangabaú', 27),
('Secretaria Municipal de o Trabalho', 26),
('Ana Estela Haddad', 26),
('reunião Interna', 26),
('Câmara Municipal de São Paulo', 25),
('Centro Cultural São Paulo', 25),
('Secretaria', 24),
('Câmara Municipal', 23),
('PIS', 23),
('Secretaria de o Pessoa com Deficiência', 23),
('Anhembi', 22),
('Reatech', 22),
('Viaduto de o Chá', 22),
('Plano', 22),
('Almoço', 22),
('Segunda Feira', 22),
('Quinta Feira', 22),
('Rosa para Mulheres com Deficiência', 22),
('SUS', 21),
('SPTrans', 21),
('Secretária Terça-Feira', 21),
('Av. Paulista', 20),
('Serviço', 20),
('Rede', 20),
('SAAI', 20),
('Secretária Sexta-feira', 20),
('São Paulo Carinhosa', 20),
('Sexta Feira', 20),
('Itaim Paulista', 20),
('Secretarias', 19),
('CET', 19),
('Secretária Quinta-Feira', 19),
('Viaduto Jacareí', 19),
('Bovinu', 19),
('Secretaria Municipal de Cultura', 19),
('Terça Feira', 19),
('Rua Lìbero Badaró', 19),
('Agenda Externa', 19),
('Rosa', 19),
('Educação', 18),
('Ministério de o Trabalho', 18),
('Butantã', 18),
('Secretária Quarta-Feira', 18),
('M’Boi Mirim', 18),
('Secretário Adjunto Sexta-feira', 17),
('Sapopemba', 17),
('ONU', 16),
('Saúde', 16),
('Praça de o Artes', 16),
('Secretário Adjunto Quinta-feira', 16),
('Anderson', 16),
('AACD', 16),
('eSSENTIAL Accessibility', 16),
('LBI', 16),
('Encontro', 15),
('IBGE', 15),
('Vergueiro', 15),
('Secretária Sexta-Feira', 15),
('Secretária segunda-feira', 15),
('Secretária Sexta', 15),
('Secretário Adjunto Segunda-feira', 15),
('Liberdade', 15),
('América Acessível', 15),
('Silvana Cambiaghi', 14),
('Subprefeituras', 14),
('EMEF', 14),
('Universal', 14),
('Secretária Quinta-feira', 14),
('Prof', 14),
('Ibirapuera', 14),
('Quarta Feira', 14),
('Externa', 14),
('Ney Matogrosso', 14),
('Secretaria Municipal de Educação', 13),
('Instituto Olga Kos', 13),
('Chefe de Gabinete', 13),
('Palestra', 13),
('Secretária Terça', 13),
('SMADS', 13),
('Mercado Municipal', 13),
('Chefia de Gabinete', 13),
('Lei Brasileira de Inclusão', 13),
('Secretaria Municipal de Saúde', 12),
('Plano Nacional Viver Sem Limite', 12),
('Guarda Civil Metropolitana', 12),
('Secretária Quinta', 12),
('Adjunto', 12),
('CER', 12),
('Plano Municipal de Ações Articuladas para Pessoas com Deficiência', 12),
('CCSP', 12),
('Alma de Batera', 12),
('Ipiranga', 12),
('Reuniões Internas', 12),
('Campo Limpo', 12),
('Brincar Inclusivo', 12),
('Decreto', 11),
('Pessoas com Deficiência', 11),
('Secretário', 11),
('Programa', 11),
('Pública', 11),
('Censo', 11),
('Secretária quarta-feira', 11),
('Pessoa', 11),
('Profa', 11),
('Direitos Humanos e Cidadania', 11),
('Mara Gabrilli', 11),
('Gilberto Frachetta', 11),
('Secretária Sabado', 11),
('Parque de o Ibirapuera', 11),
('Paralimpíadas Escolares', 11),
('Lapa', 11),
('CEUs', 11),
('Perus', 11),
('Marianne Pinotti Terça', 11),
('Marianne Pinotti Domingo', 11),
('São Mateus', 11),
('Governo', 10),
('Seminário', 10),
('Ministério de o Saúde', 10),
('José Carlos de o Carmo', 10),
('Vale de o Anhangabaú', 10),
('Secretária Segunda-feira', 10),
('Tecnologia Assistiva', 10),
('Rua Martins', 10),
('ABNT', 10),
('DF', 10),
('ANTP', 10),
('Rua São Bento', 10),
('Secretária Quarta', 10),
('Roberto Carlos', 10),
('eSSENTIAL', 10),
('Secretário Adjunto - Dudu Braga', 10)]
tokens = nlp(''.join(str(procuradoria_geral_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/procuradoria_geral_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('PROCURADOR GERAL', 85),
('PGM', 27),
('Dra', 19),
('Procuradoria Geral de o Município', 15),
('Tribunal de Justiça', 12),
('Secretaria Municipal de Governo', 12),
('Secretário Municipal de Justiça', 11),
('Junta Orçamentária Financeira', 10),
('Secretaria Municipal de Justiça', 10),
('CBAr', 10),
('COHAB', 10),
('Dr. Tiago Rossi', 9),
('Secretária Municipal de Desestatização e Parcerias', 9),
('JOF', 9),
('Prefeitura de São Paulo', 7),
('CEJUSC Municipal', 7),
('Procurador Geral', 7),
('Sistemas de Solução de Disputas com o Poder Público', 7),
('Rubens Rizek Junior', 6),
('Despachos Internos', 6),
('São Paulo', 6),
('Departamento Fiscal', 6),
('Administração Pública', 6),
('STF', 6),
('Dr', 6),
('TJSP', 5),
('SGM', 5),
('Procuradoria Geral de o Município de São Paulo', 5),
('Núcleo de Inovação e Tecnologia', 5),
('Ordinária de o Conselho', 5),
('Ministério Público', 5),
('Câmara Municipal', 4),
('prefeitura de São Paulo', 4),
('Luciana Nardi', 4),
('Mauricio Morais Tonin', 4),
('Departamento de Desapropriações', 4),
('Secretaria Nacional de Justiça', 4),
('Ticiana Nascimento', 4),
('Ministério de o Justiça e Segurança Pública', 4),
('Poder Público', 4),
('Dr. Ricardo Ferrari', 4),
('Daniel Annenberg', 4),
('comitê Brasileiro de Arbitragem', 4),
('Edifício Matarazzo', 3),
('CEJUSC MUNICIPAL', 3),
('Cejusc Municipal', 3),
('Defensoria Pública', 3),
('Nupemec', 3),
('Cejusc', 3),
('Ricardo Pereira Junior', 3),
('SMJ', 3),
('Cerimônia', 3),
('Fazenda', 3),
('Dr. Rubens Rizek', 3),
('Municipalidade', 3),
('SP', 3),
('CPC', 3),
('Secretária Nacional de Justiça', 3),
('Maria Hilda Marsiaj Pinto', 3),
('Ellen Gracie', 3),
('AGU', 3),
('Mauricio Tonin', 3),
('Práticas em Solução de Conflitos com o Poder Público', 3),
('Dr. William Calado', 3),
('Seminário “ Conciliação , Mediação', 3),
('PGE', 3),
('RS', 3),
('USP', 3),
('Kazuo Watanabe', 3),
('Secretário de Inovação e Tecnologia -', 3),
('Seminário : Conciliação , Mediação', 3),
('João Cury', 3),
('Ricardo Anafe', 3),
('Vera Monteiro de Barros', 3),
('Renata Porto Adri', 3),
('Gladys Assumpção', 3),
('Elisa Berton Eidt', 3),
('Ação Civil Pública', 2),
('Edital 01 /2017', 2),
('Viaduto de o Chá', 2),
('CEJUSC de o Fazenda Pública', 2),
('Centro Judiciário de Solução de Conflitos e Cidadania de o Prefeitura de São Paulo',
2),
('Guardas Civis Metropolitanos', 2),
('Comandante Geral de o Guarda Civil Metropolitana', 2),
('Cejusc Central', 2),
('CEJUSC Central', 2),
('Dr. Luiz Paulo Zerbini', 2),
('Assinatura de termo de Cessão de Uso', 2),
('Convênio', 2),
('estado de São Paulo', 2),
('Instalação de o Centro Judiciário de Solução de Conflitos e Cidadania', 2),
('CEJUSC', 2),
('Milton Alves', 2),
('Secretaria Municipal de Desestatização e Parcerias', 2),
('Despacho Semanal com o Secretaria Municipal de o Justiça', 2),
('MINISTÉRIO', 2),
('Ministério de o Justiça', 2),
('Caixa de Assistência de o Advogados', 2),
('Secretário Municipal', 2),
('ISSQN', 2),
('Procurador Geral de o Município', 2),
('Poder Judiciário', 2),
('Dr. Rogério Perna', 2),
('MJ', 2),
('Seminário sobre “ bom Práticas em Solução de Conflitos com o Poder Público',
2),
('Guilherme Bueno de Camargo', 2),
('Ministra', 2),
('Programação Completa', 2),
('Tribunal de Justiça de São Paulo', 2),
('Secretário Nacional de o Consumidor', 2),
('Damil Roldan', 2),
('Nilma Abe', 2),
('Blumenau', 2),
('Cleide Pompermaier', 2),
('Marcia Terlizzi', 2),
('Ricardo Ferrari', 2),
('Flavia Becker', 2),
('Juliana Marzagão', 2),
('Dr. Fernando Brega', 2),
('Dr Rubens Rizek', 2),
('Dr Renato Stetner', 2),
('Dr Ricardo Rosário', 2),
('Sr', 2),
('Brigadeiro Zotti', 2),
('Dr. Rafael Felga', 2),
('Dra Ticiana Nascimento', 2),
('Dr. Nelson Alessio', 2),
('Dr. Nédio Rosselli', 2),
('João Antonio', 2),
('Dr. Carlos Mourão', 2),
('Luciana Russo', 2),
('Solenidade', 2),
('STJ', 2),
('João Otavio de Noronha e Audiência', 2),
('Ministro Gilmar Mendes', 2),
('Acordo de Cooperação', 2),
('Rio Grande de o Sul', 2),
('TRF', 2),
('MPU', 2),
('FGV', 2),
('Cejur', 2),
('Dr. Renato Stetner', 2),
('Dr. Roberto Gazarini Dutra', 2),
('Flavia Moraes Barros', 2),
('Senhor Pedro José de o Silva', 2),
('Tribunal de Justiça de o Estado de São Paulo', 2),
('Secretário Adjunto de Justiça', 2),
('Dr. Renato Parreira Stetner', 2),
('Dr. Guilherme Bueno de Camargo', 2),
('Dr. Rafael Francisco Alves', 2),
('Bruno Takahashi', 2),
('Monica Mendonça Costa', 2),
('Cidade Tiradentes', 2),
('CEU Água Azul', 2),
('MM Juíza', 1),
('Vara de o Trabalho de o Tribunal Regional de o Trabalho', 1),
('CÂMARA de CONCILIAÇÃO de Precatórios', 1),
('RESULTADO de o JULGAMENTO', 1),
('Câmara de Conciliação de Precatórios', 1),
('Posto de Atendimento', 1),
('cep', 1),
('Indenização por Dano', 1),
('Vila Nova Cachoeirinha', 1),
('Serviço Funerário Municipal', 1),
('TJ-SP', 1),
('Departamento Judicial', 1),
('Assessoria Técnica Consultiva de o Procuradoria Geral de o Município', 1),
('DEMAP', 1),
('Pierre Ramon Alves de Oliveira', 1),
('Administração Municipal', 1),
('ATIVIDADE', 1),
('Centro', 1),
('Capital', 1),
('Gabinete de o Secretaria Municipal de Segurança Urbana', 1),
('Coronel Celso Aparecido Monari', 1),
('Carlos Alexandre Braga', 1),
('Procuradora Chefe de Gabinete', 1),
('Dr. José Carlos Ferreira Alves', 1),
('Dr. Ricardo Pereira Júnior', 1),
('Vereadora Janaína Lima', 1),
('Câmara Municipal de São Paulo', 1),
('Procurador de o Município', 1),
('Celso Aparecido Monari', 1),
('Chefe de Gabinete', 1),
('SMSU', 1),
('Gabinete', 1),
('José Carlos Ferreira Alves', 1),
('Calos Alexandre Braga', 1),
('Comandante Geral', 1),
('GCM', 1),
('Talita Silverio', 1),
('Carlos Alexandre Braga Chefe de Gabinete de o Secretaria de Segurança Urbana',
1),
('Celso Aparecido Monari Chefe de Gabinete', 1),
('José Carlos Ferreira Alves Celso Aparecido Monari', 1),
('Secretaria Municipal de Segurança Urbana', 1),
('Fotos', 1),
('Heloisa Ballarini', 1),
('Requerimento de Certidão de Desapropriação e Melhoramento Online Contribuinte',
1),
('JOF - Junta Orçamentária Financeira', 1),
('Iluminação', 1)]
tokens = nlp(''.join(str(procuradoria_geral_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/procuradoria_geral_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[]
tokens = nlp(''.join(str(relacoes_internacionais_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/relacoes_internacionais_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('São Paulo', 179),
('Brasil', 73),
('Relações Internacionais', 69),
('Secretário Luiz Alvaro', 53),
('Julio Serson', 51),
('Luiz Alvaro', 50),
('prefeitura de São Paulo', 45),
('São Paulo Aberta', 40),
('Affonso Massot', 37),
('cidade de São Paulo', 36),
('Governo', 33),
('Embaixador Affonso Massot', 30),
('Secretaria Municipal de Relações Internacionais', 28),
('Secretaria de Relações Internacionais', 28),
('Cidade de São Paulo', 28),
('Espanha', 28),
('Luiz Alvaro Salles Aguiar de Menezes', 26),
('Secretário de Relações Internacionais', 25),
('João Doria', 24),
('de São Paulo', 24),
('OGP', 23),
('Secretário Municipal de Relações Internacionais', 22),
('SP', 20),
('Cônsul-Geral', 20),
('SMRI', 19),
('Plano de Ação em Governo', 19),
('Sra', 18),
('Buenos Aires', 17),
('Open Government Partnership', 17),
('Madri', 17),
('Prefeito Bruno Covas', 17),
('Programa Agentes de Governo', 16),
('China', 16),
('Prefeitura de São Paulo', 15),
('Doria', 15),
('Fórum de Gestão Compartilhada', 15),
('Brasília', 15),
('Estados Unidos', 14),
('Argentina', 14),
('América Latina', 14),
('Bruno Covas', 13),
('Prefeitura Municipal de São Paulo', 13),
('Júlio Serson', 13),
('Prefeito Doria', 12),
('Agentes de Governo', 12),
('Secretário Adjunto de Relações Internacionais', 12),
('Rodrigo Massi', 12),
('Diálogo', 12),
('UCCI', 12),
('Wilson Poit', 11),
('Portugal', 11),
('Plano de Ação de Governo', 10),
('Prefeituras Regionais', 10),
('Cônsul Geral', 10),
('Controladoria Geral de o Município', 9),
('Desestatização e Parcerias', 9),
('Encontro', 9),
('França', 9),
('Coreia de o Sul', 9),
('SMIT', 9),
('ONU', 9),
('Itália', 8),
('Prefeito João Doria', 8),
('Intersecretarial de Governo', 8),
('Secretário Adjunto', 8),
('BID', 8),
('Suécia', 8),
('André Sturm', 7),
('Cultura', 7),
('Plano Municipal de Governo', 7),
('Abertos', 7),
('Audiência Pública', 7),
('EUA', 7),
('Seul', 7),
('Nova York', 7),
('Fórum de Gestão', 6),
('Plano de Ação', 6),
('Pública', 6),
('Emirados Árabes Unidos', 6),
('Edifício Matarazzo', 6),
('Viaduto de o Chá', 6),
('CGM', 6),
('Rússia', 6),
('CIGA-SP', 6),
('Paris', 6),
('Japão', 6),
('Person Of The Year', 6),
('Washington', 6),
('Mayor João Doria', 6),
('Vice-Cônsul', 6),
('Centro', 6),
('2º Plano de Ação em Governo', 6),
('Plano', 6),
('III Encontro Brasileiro de Governo', 6),
('Azerbaijão', 6),
('Irlanda', 6),
('Banco Mundial', 6),
('Sri Lanka', 6),
('Secretaria de Inovação e Tecnologia', 5),
('Transparência e Participação Social', 5),
('Anderson Pomini', 5),
('Justiça', 5),
('Michele Pala', 5),
('Miguel Setas', 5),
('Gilberto Natalini', 5),
('Edital', 5),
('Comunicação', 5),
('cidade de', 5),
('Câmara de Comércio', 5),
('Líbano', 5),
('Educação', 5),
('Brieuc Pont', 5),
('32 Prefeituras Regionais', 5),
('Edifício Martinelli', 5),
('Chile', 5),
('Brittany Lane', 5),
('México', 5),
('Canadá', 5),
('Geraldo Alckmin', 5),
('Bloomberg Philanthropies', 5),
('Portuguese version', 5),
('Cônsul', 5),
('Parceria', 5),
('Programa de Metas', 5),
('Cônsul Geral de o Grécia', 5),
('Cônsul Honorário', 5),
('Secretaria Municipal de Inovação e Tecnologia', 5),
('Combate a o Corrupção', 5),
('ODS', 5),
('Egito', 5),
('Dia de São Patrício', 5),
('República Tcheca', 5),
('Singapura', 5),
('RETPS', 4),
('Juan Quirós', 4),
('Antonio Bernardini', 4),
('EDP Brasil', 4),
('Vice-Prefeito', 4),
('Verde e Meio Ambiente', 4),
('Coreia', 4),
('ACONBRAS', 4),
('Prefeito', 4),
('Davos', 4),
('Butantã', 4),
('Plano Municipal de Desestatização', 4),
('estado de Israel', 4),
('Israel', 4),
('Secretário Adjunto Affonso Massot', 4),
('Consulado', 4),
('Conselho de Relações Internacionais', 4),
('Cônsul Geral de o Áustria', 4),
('Bélgica', 4),
('América de o Sul', 4),
('Conselho de Gestão de Relações Internacionais', 4),
('sr. Stylianos Hourmouziadis', 4),
('Consul Honorário', 4),
('Rede', 4),
('Cônsul Geral de o Emirados Árabes', 4),
('sr. Ibrahim Salem Alalawi', 4),
('Relações Internacionais Embaixador Affonso Massot', 4),
('FIESP', 4),
('Supervisão para Assuntos de Governo', 4),
('Gustavo Ungaro', 4),
('Consulado-Geral de', 4),
('Cidadão', 4),
('Daniel Annenberg', 4),
('Sanjay Pradhan', 4),
('Ciência e o Cultura', 4),
('Rio de Janeiro', 4),
('Cidade Matarazzo', 4),
('Hungria', 4),
('Diretora', 4),
('Secretário Executivo de Relações Internacionais', 4),
('Ana Carolina Lafemina', 4),
('AECID', 4),
('OEI', 4),
('Museu de o Imigração', 4),
('Centro Cultural Coreano', 4),
('CGLU', 4),
('Luxemburgo', 4),
('Conferência Internacional de o Diversidade e Turismo LGBT', 4),
('Embaixada de Singapura', 3),
('Embaixada', 3),
('David Barioni', 3),
('SPTuris', 3),
('Consulado Geral de', 3),
('Alemanha', 3),
('Largo de o Arouche', 3),
('Tecnologia Aberta e Colaborativa', 3),
('Austin', 3),
('Coréia', 3),
('Tbilisi', 3),
('Fórum Econômico Mundial', 3),
('Suíça', 3),
('CEO', 3),
('Caio Megale', 3),
('Bom Retiro', 3),
('In', 3),
('São Paulo Encontro', 3),
('Dubai', 3)]
tokens = nlp(''.join(str(relacoes_internacionais_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/relacoes_internacionais_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('São Paulo', 361),
('Brasil', 148),
('de São Paulo', 112),
('Fernando Haddad', 93),
('América Latina', 59),
('prefeitura de São Paulo', 58),
('ONU', 55),
('cidade de São Paulo', 48),
('Relações Internacionais e Federativas', 47),
('Argentina', 46),
('Mercocidades', 46),
('Prefeitura de São Paulo', 45),
('Mercosul', 42),
('Rosário', 41),
('Habitat III', 40),
('SMRIF', 38),
('Montevidéu', 37),
('Vicente Trevas', 36),
('Nádia Campeão', 35),
('Leonardo Barchini', 35),
('Brasília', 33),
('Haddad', 32),
('Uruguai', 29),
('Buenos Aires', 28),
('PMSP', 27),
('CEPAL', 27),
('C40', 24),
('Rio de Janeiro', 23),
('Plano diretor Estratégico', 23),
('FONARI', 23),
('PDE', 23),
('Espanha', 21),
('Braços Abertos', 21),
('Leonardo Barchini Rosa', 20),
('França', 20),
('Nações Unidas', 20),
('Relações Internacionais', 20),
('Chile', 20),
('Córdoba', 20),
('Expo 2020', 19),
('Prefeito Fernando Haddad', 19),
('México', 19),
('EXPO 2020', 19),
('Secom', 19),
('China', 18),
('Prefeito', 18),
('América de o Sul', 18),
('Secretaria de Relações Internacionais e Federativas', 18),
('Estados Unidos', 18),
('Cidade de o México', 17),
('Bogotá', 17),
('Osaka', 17),
('Secretário', 16),
('Barchini', 16),
('CGLU', 16),
('Londres', 16),
('Cidade de São Paulo', 15),
('Vice-Prefeita Nádia Campeão', 15),
('Cingapura', 15),
('ONU-Habitat', 15),
('Plano', 15),
('FNP', 15),
('SPMun', 15),
('MSur', 15),
('III EMDS', 15),
('Secretaria Municipal de Relações Internacionais e Federativas', 14),
('África de o Sul', 14),
('Amsterdã', 14),
('Copa de o Mundo', 14),
('Holanda', 14),
('Despachos Internos', 14),
('São Paulo Aberta', 14),
('Secretário de Relações Internacionais e Federativas', 13),
('Desenvolvimento Urbano', 13),
('SPTrans', 13),
('Estocolmo', 13),
('Nova York', 13),
('Rede', 13),
('Santiago', 13),
('Frente Nacional de Prefeitos', 13),
('FCCR', 13),
('BIAU', 13),
('Organização de o Nações Unidas', 12),
('Praça de o Artes', 12),
('Reino Unido', 12),
('Vancouver', 12),
('EMDS', 12),
('PNUD', 11),
('Centro', 11),
('SP', 11),
('OEI', 11),
('Luz', 11),
('Trevas', 11),
('Quito', 11),
('EUA', 10),
('Turquia', 10),
('Prefeitura', 10),
('Paris', 10),
('Alemanha', 10),
('Colômbia', 10),
('Líbano', 10),
('Ana Estela Haddad', 10),
('Etiópia', 10),
('Belo Horizonte', 10),
('De Braços Abertos', 10),
('Governo', 10),
('Istambul', 9),
('Pirituba', 9),
('Ciro Biderman', 9),
('Venezuela', 9),
('Canoas', 9),
('OIT', 9),
('Fernando de Mello Franco', 9),
('Caribe', 9),
('Europa', 9),
('Força Tarefa Global', 9),
('Secretário Municipal de Relações Internacionais e Federativas', 8),
('Bélgica', 8),
('Roberto Porto', 8),
('Assentamentos Humanos', 8),
('Vice-Prefeita', 8),
('USP', 8),
('Direitos Humanos', 8),
('Expresso Tiradentes', 8),
('Nabil Bonduki', 8),
('Barcelona', 8),
('Paraguai', 8),
('PrepCom', 8),
('Secretaria', 8),
('III Encontro de o Municípios com o Desenvolvimento Sustentável', 8),
('Cônsul-Geral', 7),
('Exposição Universal', 7),
('Azerbaijão', 7),
('Prefeito Haddad', 7),
('Cidade', 7),
('Porto Alegre', 7),
('Programa de o Nações Unidas para o Desenvolvimento', 7),
('Joanesburgo', 7),
('UFABC', 7),
('CEUs', 7),
('Juca Ferreira', 7),
('Nadia Campeão', 7),
('Memorando de Entendimento', 7),
('Luciana Temer', 7),
('Comunicação', 7),
('Fábio Arantes', 7),
('CAF', 7),
('Conferência', 7),
('Canadá', 7),
('IX BIAU', 7),
('ODS', 7),
('Despacho Interno', 7),
('Sala Temática', 7),
('Governo Federal', 6),
('Portugal', 6),
('Secretário-Adjunto de Relações Internacionais e Federativas', 6),
('Quênia', 6),
('Programa', 6),
('New Cities Foundation', 6),
('Educação', 6),
('Cônsul Geral', 6),
('Leonardo Osvaldo Barchini Rosa', 6),
('Dongguan', 6),
('Santa Fé', 6),
('SMDHC', 6),
('Diálogos SP em o Mundo', 6),
('Capital', 6),
('Conselho Participativo Municipal', 6),
('Arena Corinthians', 6),
('Direitos Humanos e Cidadania', 6),
('São Paulo Carinhosa', 6),
('Rogério Sottilli', 6),
('Secretaria executiva de Comunicação', 6),
('Seigo Tanaka', 6),
('Províncias', 6),
('Departamentos', 6),
('Moradia', 6),
('Rede Mercocidades', 6),
('SpTrans', 6),
('MobiLab', 6),
('Equador', 6),
('Mafalda', 6),
('Secretário Leonardo Osvaldo Barchini Rosa Segunda', 6),
('Cônsul', 5),
('Damien Loras', 5),
('Tailândia', 5),
('Estados', 5),
('CET', 5),
('Clima', 5),
('Região Metropolitana de São Paulo', 5),
('Sustentabilidade', 5),
('São Paulo Model United Nations', 5),
('José Floriano', 5),
('Durban', 5),
('LGBT', 5),
('Nádia', 5),
('Organização Internacional de o Trabalho', 5),
('IPEA', 5),
('Imigrantes', 5),
('Porto', 5)]
tokens = nlp(''.join(str(relacoes_sociais_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/relacoes_sociais_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('Conselho Participativo', 14),
('Conselho Participativo Municipal', 14),
('Secretaria Especial de Relações Sociais', 7),
('Secretário Especial de Relações Sociais', 6),
('Secretaria Especial de Relações Governamentais', 5),
('de São Paulo', 4),
('Prefeituras Regionais', 4),
('SP', 4),
('cidade de São Paulo', 4),
('Secretaria de Relações Sociais', 4),
('Grande Auditório de o Anhembi', 4),
('Edital 39', 4),
('Milton Flávio', 3),
('Regionais', 3),
('Celso Henriques de Paula', 3),
('Facebook', 3),
('São Paulo', 3),
('Prefeitura de São Paulo', 3),
('Prefeitura Regional', 3),
('ZONA', 3),
('Programa Profissão Cidadão', 3),
('Metrô', 3),
('SERS', 3),
('Anhembi', 3),
('Latin Code Week', 3),
('Zona Leste', 3),
('Brasil', 3),
('Coordenação de Diálogo e Participação Social', 3),
('Centro Esportivo', 3),
('Bairros', 3),
('São Mateus', 3),
('Conselho de o Idoso', 2),
('Facebook de o Secretaria Especial de Relações Governamentais', 2),
('Poder Público', 2),
('Municipal', 2),
('Comissão Eleitoral Central', 2),
('Edital de Incrição', 2),
('Anexo único aqui', 2),
('Decreto nº57.829 Anexos II', 2),
('Kit Inscrições Brasileiros aqui Kit Inscrições imigrante', 2),
('Comissão Eleitoral', 2),
('Central', 2),
('Coordenador Geral de Relações Governamentais Celso Henriques de Paula', 2),
('AUDIÊNCIA Pública', 2),
('Câmara Municipal de São Paulo', 2),
('Viaduto Jacareí', 2),
('Cracolândia', 2),
('Regional', 2),
('Retificação de o Edital 31', 2),
('SERG2017 de Prorrogação de Inscrição para Mulheres aqui', 2),
('SERG2017', 2),
('Secretário Sergio Avelleda', 2),
('PRODAM', 2),
('VOTAÇÃO', 2),
('DIÁRIO OFICIAL', 2),
('CONSELHO Participativo', 2),
('Cerimônia', 2),
('estação Tietê', 2),
('Executivo', 2),
('Secretário Especial Milton Flávio', 2),
('Lei', 2),
('São o Eleitos Que', 2),
('SÁBADO', 2),
('Edital 38', 2),
('Metrô Tietê', 2),
('prefeitura de São Paulo', 2),
('SAP Brasil', 2),
('Secretaria de o Pessoa com Deficiência', 2),
('Governo Municipal', 2),
('Administração Pública Municipal', 2),
('Clube Tietê', 2),
('Ibirapuera', 2),
('Kung Fu', 2),
('Mutirão', 2),
('CRAS', 2),
('Cultura', 2),
('Câmara de São Paulo', 1),
('Câmera Municipal de São Paulo', 1),
('Relações Governamentais', 1),
('Estatuto de o Idoso', 1),
('IBGE', 1),
('Instituto Brasileiro de Geografia e Estatística', 1),
('Grande Conselho', 1),
('Clotilde Benedik de Sousa', 1),
('Direitos Humanos', 1),
('1ª Conferência de o Conselho Participativo', 1),
('Norte', 1),
('Sul', 1),
('Leste', 1),
('Centro Oeste', 1),
('Sudeste', 1),
('DEPAV', 1),
('Departamento de Parques', 1),
('área Verdes', 1),
('Edson Morais Bueno', 1),
('Conselho Participativo Municipal Celso Henriques de Paula', 1),
('Conselho Participativo e Cades', 1),
('Conselho Municipal de o Meio Ambiente e Desenvolvimento Sustentável', 1),
('Meio Ambiente', 1),
('Coordenador', 1),
('Regionais Norte', 1),
('Conselho Participativo Inscrições', 1),
('cidade de', 1),
('32 Prefeituras Regionais', 1),
('Estadual e Federal', 1),
('Auditório Prestes Maia', 1),
('PL', 1),
('João Agripino de o Costa Doria Junior', 1),
('AUTORIZA', 1),
('ALIENAÇÃO de o PARTICIPAÇÃO Societária detidar', 1),
('São Paulo TuRisMO S.A.', 1),
('NAS CONDIÇÕES', 1),
('Cracolândia Pesquisa', 1),
('Projeto Redenção', 1),
('Primeira Onda', 1),
('Secretário Especial de Relações Governamentais Milton Flávio', 1),
('Secretaria de Estado de Desenvolvimento Social de São Paulo', 1),
('SEDS', 1),
('Programa de o Nações Unidas', 1),
('Pnud', 1),
('Mulheres Imigrantes', 1),
('Prefeituras Regionais 5/10/2017 Atenção Mulher Imigrante', 1),
('Mulher !', 1),
('Conselho Participativo ?', 1),
('Estadual e Federal - Detentores', 1),
('Membros de o Comissão Eleitoral Central', 1),
('Nacional de Habilitação', 1),
('CNH', 1),
('Carteira de trabalho', 1),
('Passaporte ou Carteira Funcional', 1),
('Decreto', 1),
('Decreto Municipal', 1),
('Face book ?', 1),
('3/11/2017 Audiência Pública de o Comissão de Política Urbana', 1),
('Metropolitana e Meio Ambiente o Comissão conver o', 1),
('CET', 1),
('sr. João Octaviano', 1),
('Mortes em o Trânsito', 1),
('Poder Público ?', 1),
('Horário', 1),
('VIVO', 1),
('conselho Participativos', 1),
('SMDHC', 1),
('Rua Líbero Badaró', 1),
('Inscrivez-vous', 1),
('Élections pour le Conseil Participatif', 1),
('Aidez', 1),
('Register', 1),
('December 3rd', 1),
('Help elect the representative for your region !', 1),
('Regístrese 6/11/2017 ESPANÕL', 1),
('Elecciones del Consejo Participativo', 1),
('Regístrese', 1),
('Secretaria de Municipal de Inovação e Tecnologia', 1),
('Roberto Celkevicius', 1),
('DISTRITO', 1),
('DISTRITO Planilha', 1),
('CPM 2017', 1),
('Zonas Eleitorais e Locais', 1),
('TRE', 1),
('RETIFICAÇÃO LOCAIS', 1),
('Coordenador de o Eleição de o Conselho Participativo Celso Henriques', 1),
('PROGRAMA PROFISSão CIDADÃO', 1),
('TIMELINE', 1),
('Secretário Especial de Relações Sociais Milton Flávio', 1),
('Governo', 1),
('Júlio Semeghini', 1),
('Secretário de Esporte Jorge Damião', 1),
('Secretária de o Trabalho e Empreendedorismo Aline Cardoso', 1),
('Controlador Geral de o Município', 1),
('CGM Rodrigo Mendes', 1),
('André Santos', 1),
('Coordenador de o Conselho Participativo Municipal Celso Henriques', 1),
('Prefeitos Regionais de Jabaquara', 1),
('Campo Limpo', 1),
('Parelheiros', 1),
('Hino Nacional', 1),
('Coral de o Oficina de Arte e Cultura', 1),
('Maestro Roberto Mendes Barbosa', 1),
('Escola de Samba Unidos de Vila Maria', 1),
('Web Aula Marcelo Smith', 1),
('Capacitação Profissional , Desenvolvimento Pessoal , Gestão e Liderança , Informática',
1),
('Internet', 1),
('WebAula Marcelo Smith', 1),
('Brasileiros', 1),
('COMUNICAÇÃO Secretaria Especial de Relações Sociais', 1),
('Pág 154 Classificação', 1),
('Eleitos', 1),
('pág 34', 1),
('Pág 31 Tabela', 1),
('Brasileiros Imigrantes', 1),
('Conselho Participativo Municipal 8/01/2018 1ª', 1),
('Conselho Participativo 2017', 1),
('Eleição de o Conselho Participativo', 1),
('Conselho Inscrivez-vous Register Regístrese Conselho Participativo Municipal',
1),
('DISTRITO INFORME', 1),
('RESULTADO', 1),
('Conselho Participativo Municipal 2017', 1),
('Conselho Participativo Municipal Criado', 1),
('Grande Auditório Celso Furtado', 1)]
tokens = nlp(''.join(str(relacoes_sociais_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/relacoes_sociais_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[]
tokens = nlp(''.join(str(seguranca_urbana_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/seguranca_urbana_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('SMSU', 290),
('GCM', 286),
('Secretário', 168),
('Gabinete de o Secretário', 145),
('Guarda Civil Metropolitana', 145),
('Gabinete', 120),
('Despachos Internos', 111),
('Viaduto de o Chá', 108),
('José Roberto Rodrigues de Oliveira', 100),
('SP', 97),
('Gabinete de o Prefeito', 87),
('City Câmeras', 80),
('Secretaria Municipal de Segurança Urbana', 72),
('São Paulo', 65),
('Secretário Municipal de Segurança Urbana', 60),
('Cidade Linda', 57),
('SMSU - Gabinete', 53),
('Sala', 47),
('Dronepol', 46),
('José Roberto', 44),
('Secretário José Roberto Rodrigues de Oliveira', 43),
('Cel', 41),
('Despachos', 40),
('Centro', 40),
('Defesa Civil', 38),
('Rua Líbero Badaró', 37),
('SMSU - Gabinete de o Secretário', 37),
('SMIT', 36),
('Secretário Sexta-feira', 35),
('Brasil', 34),
('Ulisses', 33),
('Sl', 32),
('SECOM', 28),
('Secretário de Segurança Urbana', 28),
('Gabinete de o Secretário 10h00', 27),
('Secretário Segunda-feira', 26),
('Secretário Quinta-feira', 25),
('SP+Segura', 25),
('cidade de São Paulo', 24),
('Calçada Nova', 24),
('5º Andar', 24),
('Prefeito João Doria', 24),
('Mutirão Mário Covas', 24),
('José Roberto R. de Oliveira', 24),
('Despachos Internos LOCAL : SMSU - Gabinete de o Secretário', 24),
('João Doria', 23),
('Cidade', 22),
('GCMs', 22),
('Segurança Urbana', 21),
('de São Paulo', 21),
('Bruno Covas', 20),
('Silvana', 20),
('Cidade de São Paulo', 19),
('Gabinete de o Secretário 18h00', 18),
('Kelly Ortiz', 18),
('Carlos Alexandre Braga', 18),
('DOS', 18),
('Celso Aparecido Monari', 18),
('Rua de o Consolação', 17),
('Prefeitura de São Paulo', 17),
('SGM', 17),
('Kelly Ortiz Fotos : Ulisses', 17),
('Guty', 17),
('Gabinete de o Secretário 11h00', 16),
('Polícia Militar', 16),
('SMJ', 16),
('Zona Leste', 16),
('Itaquera', 16),
('Kelly Ortiz Fotos : Gomes', 16),
('Fernando César Lorencini', 16),
('SMADS', 15),
('SMPR', 15),
('Secretário Domingo', 15),
('Gabinete de o Secretário 17h00', 14),
('SMSO', 14),
('CIDADE LINDA', 14),
('Pinheiros', 14),
('CET', 14),
('Secretário Adjunto', 14),
('SMSU -', 14),
('Gabinete de o Secretário 14h00', 13),
('Luz', 13),
('SVMA', 13),
('SMT', 13),
('Prefeito', 13),
('Adelson de Souza', 13),
('Canil', 13),
('Programa Cidade Linda', 13),
('Guarda Civil', 13),
('Prefeito Bruno Covas', 13),
('Academia de Formação em Segurança Urbana', 13),
('AFSU', 13),
('Dra', 12),
('Corpo de Bombeiros', 12),
('Ibirapuera', 12),
('Cracolândia', 12),
('Zona Sul', 12),
('Programa City Câmeras', 12),
('Secretaria', 12),
('Comandante Geral', 12),
('DRONEPOL', 12),
('Despachos Internos LOCAL - SMSU - Gabinete de o Secretário', 12),
('Bela Vista', 11),
('Governo', 11),
('PM', 11),
('Programa', 11),
('Rua Libero Badaró', 11),
('SMC', 11),
('Operacional Cidade', 11),
('Coletiva de Imprensa', 11),
('Divisão de Orientação Social', 11),
('SMSU - Rua de o Consolação', 11),
('Geraldo Alckmin', 10),
('Edifício Matarazzo', 10),
('Guarda Ambiental', 10),
('Parque de o Ibirapuera', 10),
('SMUL', 10),
('Guarda Civil Metropolitana de São Paulo', 10),
('IAMO', 10),
('Programa Guardiã Maria de o Penha', 10),
('SMG', 9),
('Gabinete de o Secretário 17h30', 9),
('Gabinete de o Secretário 16h30', 9),
('prefeitura de São Paulo', 9),
('Câmara Municipal de São Paulo', 9),
('Auditório', 9),
('João Dória', 9),
('Brás', 9),
('Vila Mariana', 9),
('IOPE', 9),
('Programa Calçada Nova', 9),
('Cerimônia', 9),
('Heni Ozi Cukier', 9),
('Polícia Civil', 9),
('Secretário José Roberto', 9),
('GGI', 9),
('Gomes', 9),
('Guarda', 8),
('Av. São João', 8),
('Secretariado', 8),
('Viaduto Jacareí', 8),
('Belenzinho', 8),
('Gabinete de o Secretário 15h30', 8),
('Secretaria de Segurança Urbana', 8),
('Distrito Policial', 8),
('Zona Norte', 8),
('Santana', 8),
('Anhembi', 8),
('USP', 8),
('Capital', 8),
('Mooca', 8),
('Civil', 8),
('ABESE', 8),
('Fernando Lorencini', 8),
('SMDHC', 8),
('José Roberto de Oliveira', 8),
('Kelly Ortiz Fotos : Guty', 8),
('Rogério Peixoto', 8),
('Despachos Internos LOCAL : SMSU -', 8),
('Gabinete de o Secretário 18h30', 7),
('Projeto Redenção', 7),
('Gabinete de o Secretário 16h00', 7),
('Telefônica', 7),
('Marginal Segura', 7),
('Receita Federal', 7),
('Gabinete de o Secretário 14h30', 7),
('Bom Retiro', 7),
('Ministério Público', 7),
('Rua Riachuelo', 7),
('Praça de o Sé', 7),
('Drones', 7),
('Sala de Imprensa', 7),
('São Mateus', 7),
('Av. Paulista', 7),
('SESVESP', 7),
('Vila Clementino', 7),
('Ipiranga', 7),
('Nova Luz', 7),
('Prefeito João Dória', 7),
('estado de São Paulo', 7),
('Programa Dronepol', 7),
('Glock', 7),
('Gabinete de Gestão Integrada', 7),
('Consolação', 7),
('GP', 7),
('CHG Prefeito', 7),
('SSP', 6),
('6º Andar', 6),
('Barra Funda', 6),
('Casa Verde', 6),
('Palácio de o Bandeirantes', 6),
('Santo Amaro', 6),
('Fábio Lepique', 6),
('Prefeitura', 6),
('Empresas Públicas', 6),
('Chefe de Gabinete', 6),
('Lidia', 6),
('Perus', 6),
('Rua Ribeiro de Lima', 6),
('Kelly Ortiz Foto : Gomes', 6)]
tokens = nlp(''.join(str(seguranca_urbana_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/seguranca_urbana_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('GCM', 806),
('Despachos Internos', 553),
('Gabinete de o Secretário', 394),
('Guarda Civil Metropolitana', 295),
('Secretaria Municipal de Segurança Urbana', 283),
('Gabinete', 237),
('Secretário', 216),
('Despachos', 170),
('SMSU', 167),
('Roberto Porto', 88),
('Secretário Sexta-feira', 79),
('São Paulo', 78),
('cidade de São Paulo', 60),
('DBA', 58),
('Gabinete de o Prefeito', 55),
('Secretário Segunda-feira', 52),
('Secretário Quinta-feira', 50),
('Cracolândia', 44),
('Guarda', 43),
('GCMs', 39),
('Feira', 38),
('Santos', 36),
('Chico Macena', 35),
('Ed Matarazzo', 35),
('Gabinete de o Secretário 15h00', 35),
('CFSU', 33),
('Centro de Formação em Segurança Urbana', 33),
('Prefeito', 32),
('Comandante Geral', 32),
('Ricardo Teixeira', 32),
('Gabinete de o Secretário 11h00', 32),
('Fernando Haddad', 31),
('Guarda Ambiental', 31),
('Edifício Matarazzo', 31),
('Segurança Urbana', 31),
('Câmara Municipal', 30),
('Viaduto de o Chá', 30),
('Gabinete de o Secretário 16h00', 30),
('Polícia Militar', 29),
('Parelheiros', 29),
('Instituto', 29),
('Paz', 29),
('Secretaria Municipal de Segurança Urban', 29),
('Cmte Gilson Menezes', 29),
('Brasil', 28),
('Marcus Vinicius', 27),
('Distrito Policial', 27),
('Gilson Menezes', 27),
('Ari Friedenbach', 27),
('Mônica Casanova', 26),
('Dra', 26),
('Luciana Temer', 26),
('Secretário Terça', 26),
('Gabinete de o Secretário 17h00', 25),
('Ministério Público', 24),
('CET', 24),
('SMADS', 24),
('Inspetor Gilson Menezes', 23),
('Secretário Quinta', 23),
('Secretário Quarta', 23),
('SMDHC', 22),
('Comandante Gilson Menezes', 22),
('de São Paulo', 21),
('Controle de o Espaço Público e Fiscalização de o Comércio Ambulante', 21),
('Braços Abertos', 21),
('Secretário Sexta', 21),
('Secretário Municipal de Segurança Urbana', 19),
('SP', 19),
('Guardas Civis', 19),
('Guardas Civis Metropolitanos', 19),
('Simão Pedro', 19),
('Campanha de o Desarmamento', 19),
('Guardiã Maria de o Penha', 19),
('Nádia Campeão', 18),
('Centro', 18),
('Itaquera', 18),
('Paola Bernal', 18),
('Guty', 18),
('Rogério Sottili', 18),
('Matarazzo', 18),
('SMSP', 18),
('Guarda Civil', 17),
('Rua Líbero Badaró', 17),
('Gabinete de o Secretário 18h00', 17),
('Corregedor', 17),
('Sede DBA', 17),
('Anhembi', 16),
('Parque Ibirapuera', 16),
('Parque de o Ibirapuera', 16),
('Secretário Quarta-Feira', 16),
('Comando Geral de', 16),
('Canil', 16),
('IOPE', 16),
('Secretário Sexta-Feira', 16),
('Ed', 16),
('Augusta', 16),
('Imprensa', 16),
('Polícia Civil', 15),
('SGM', 15),
('Ulisses', 15),
('Nunzio Briguglio', 15),
('USP', 15),
('TRIOS', 15),
('Vale de o Anhangabaú', 14),
('Comandante Geral de o Guarda Civil Metropolitana', 14),
('Santana', 14),
('Thays Librelon', 14),
('Casas de Mediação de Conflitos', 14),
('Direitos Humanos', 14),
('Inspetoria Regional', 14),
('Avenida Paulista', 14),
('SMSU : Foto', 14),
('Ministério de o Justiça', 14),
('Rua Libero Badaró', 14),
('Gabinete de o Secretário 17h30', 14),
('Marcelo Ulisses', 13),
('Sé', 13),
('Zona Leste', 13),
('Zona Norte', 13),
('Santo Amaro', 13),
('CDs', 13),
('Paola de Carvalho Bernal', 13),
('Coral', 13),
('Secretário Terça-Feira', 13),
('Bom Retiro', 13),
('Despachos Internos Local: Gabinete de o Secretário', 13),
('Gabinete de o Secretário 14h00', 13),
('Eduardo de Siqueira Bias', 12),
('Segurança Pública', 12),
('Subprefeitura de o Sé', 12),
('Jaraguá', 12),
('Classe Distinta', 12),
('Capela de o Socorro', 12),
('Itaim Paulista', 12),
('Jilmar Tatto', 12),
('Secretário Quinta-Feira', 12),
('ROBERTO PORTO', 12),
('GEVID', 12),
('cidade de', 11),
('Central', 11),
('Programa de Proteção Ambiental', 11),
('Casas de Mediação', 11),
('Perus', 11),
('Programa', 11),
('Superintendente de Planejamento', 11),
('PM', 11),
('Cel', 11),
('Secretaria Municipal de segurança Urbana', 11),
('Menezes', 11),
('Classes Distintas', 11),
('Secretário Quarta Feira', 11),
('Inspetor de Divisão Gilson Menezes', 11),
('Benedito Mariano', 11),
('Coordenação DBA', 11),
('Haddad', 10),
('Lei', 10),
('Governo Federal', 10),
('Praça Roosevelt', 10),
('SPTrans', 10),
('Ibirapuera', 10),
('Guarda Civil Metropolitana Ambiental', 10),
('Comandante Regional', 10),
('estado de São Paulo', 10),
('Mooca', 10),
('Luz', 10),
('ONU', 10),
('Salão Nobre', 10),
('SDTE', 10),
('SMPM', 10),
('Inspetor Vanderlei', 10),
('Secretário Quinta Feira', 10),
('Segunda', 10),
('TCM', 10),
('Secretário Terça Feira', 10),
('SECOM', 10),
('Mariano', 10),
('Sul', 9),
('Guardas', 9),
('Gabinete de Gestão Integrada', 9),
('Capital', 9),
('Comandante Operacional Norte', 9),
('prefeitura de São Paulo', 9),
('Pinheiros', 9),
('Pirituba', 9),
('Câmara Municipal de São Paulo', 9),
('Edir Sales', 9),
('Pacaembu', 9),
('CONSEG', 9),
('Cidade de São Paulo', 9),
('Vila Mariana', 9),
('Nova Luz', 9),
('Virada Cultural', 9),
('Exército Brasileiro', 9),
('Butantã', 9),
('São Miguel Paulista', 9),
('Inspetores', 9),
('GGI', 9),
('Luis Massonetto', 9),
('Artur Henrique', 9),
('Gabinete de o Secretário 15h30', 9)]
tokens = nlp(''.join(str(seguranca_urbana_defesa_civil_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/seguranca_urbana-defesa_civil_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('Defesa Civil', 2),
('Zona Norte', 2),
('SP', 2),
('São Paulo', 2),
('Perus', 2),
('Defesa Civil de o Município', 1),
('Campo de Marte', 1),
('Cavalheiro Basílio Jafe', 1),
('rua Jorge Azem', 1),
('Cavalheiro Basílio Jafet', 1),
('Defesa Civil Oeste 5/12/2018', 1),
('Defesa Civil de o Cidade de São Paulo', 1),
('Av. Dr Gastão Vidigal', 1),
('Avenida Engenheiro Roberto Zucolo', 1),
('Lapa', 1),
('Ação Corpo de Bombeiros', 1),
('SMADS', 1),
('Defesa Civil de o Município de São Paulo', 1)]
tokens = nlp(''.join(str(seguranca_urbana_defesa_civil_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/seguranca_urbana-defesa_civil_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('Defesa Civil', 157),
('Civil', 34),
('COMDEC', 29),
('Corpo de Bombeiros', 27),
('CGE', 21),
('cidade de São Paulo', 18),
('São Paulo', 18),
('Comdec', 15),
('SAMU', 13),
('Guarda Civil Metropolitana', 12),
('Cruz Vermelha', 12),
('CET', 11),
('Coordenadoria Municipal de Defesa Civil', 10),
('Brasilândia', 10),
('Centro', 10),
('Itaquera', 10),
('CCOI', 9),
('GCM', 9),
('Centro de Gerenciamento de Emergências', 9),
('COVISA', 9),
('Defesa Civil de o Cidade de São Paulo', 9),
('Itaim Paulista', 9),
('CODDEC', 9),
('Subprefeitura', 9),
('Sé', 9),
('SMADS', 8),
('Defesa Civil Municipal', 8),
('Zona Leste', 8),
('Parque Anhanguera', 8),
('Política Nacional de Proteção e Defesa Civil', 7),
('Assistência Social', 7),
('PPCV', 7),
('São Miguel Paulista', 7),
('Santana', 7),
('Zona Norte', 7),
('USP', 7),
('Previn', 6),
('Secretaria Municipal de Coordenação de o Subprefeituras', 6),
('SP', 6),
('Polícia Militar', 6),
('Bombeiros', 6),
('Brás', 6),
('prefeitura de São Paulo', 6),
('Butantã', 6),
('Recuperativas', 6),
('Aricanduva', 5),
('PREVIN', 5),
('Meio Ambiente', 5),
('Município de São Paulo', 5),
('Defesa Civil de o Município de São Paulo', 5),
('Prefeitura de São Paulo', 5),
('IPT', 5),
('Mooca', 5),
('CRAS', 5),
('Lei', 5),
('PNPDC', 5),
('Perus', 5),
('Estação Butantã', 5),
('Coordenadoria de Defesa Civil de o Cidade de São Paulo', 5),
('Centro de Controle Operacional Integrado', 4),
('SMSP', 4),
('Subprefeituras', 4),
('Secretaria de Coordenação de o Subprefeituras', 4),
('Chuvas de Verão', 4),
('Obras', 4),
('Estação de o Luz', 4),
('CPTM', 4),
('Jaraguá', 4),
('Pirituba', 4),
('Coordenadoria Distrital de Defesa Civil', 4),
('Tucuruvi', 4),
('Cruz Vermelha Brasileira', 4),
('CETESB', 4),
('Zona Sul', 4),
('Comissão Nacional de Psicologia', 4),
('CEU Paz', 4),
('Cidade de São Paulo', 4),
('rua Paulo Ferraz', 4),
('Amanda Mendes de Sousa', 4),
('Rocha', 4),
('Tremembé', 4),
('Ecoeconomia', 4),
('Linha 4-Amarela', 4),
('Linha 4', 4),
('Ronaldo Malheiros', 4),
('Bela Cintra', 4),
('Milton Persoli', 4),
('Coordenação de Ações Preventivas', 4),
('Rua', 4),
('Samu', 4),
('PMSP', 3),
('Defesa Civil de São Paulo', 3),
('Sabesp', 3),
('Coordenação de Vigilância em Saúde', 3),
('Coordenadoria Municipal de o Defesa Civil', 3),
('Companhia de Engenharia de Tráfego', 3),
('Subprefeitura Sé', 3),
('Programa de redução de Alagamentos', 3),
('Simulado de o I Simpósio Internacional de Gerenciamento', 3),
('Hospital Albert Einstein', 3),
('Agência Adventista de Desenvolvimento e Recursos Assistenciais', 3),
('Múltiplas Vítimas', 3),
('Bom Retiro', 3),
('Vigilância em Saúde', 3),
('Ermelino Matarazzo', 3),
('Sul', 3),
('Leste', 3),
('Coordenadoria de Defesa Civil', 3),
('Defesa Civil de Parelheiros', 3),
('Santo Amaro', 3),
('Penha', 3),
('Defesa Civil de o Lapa', 3),
('Gestão Integral de Riscos', 3),
('Desastres de o Conselho Federal de Psicologia', 3),
('CFP', 3),
('Córrego de o Bananal', 3),
('Jaçanã', 3),
('Municipal de Mudança de o Clima', 3),
('PM', 3),
('Polizia di Stato', 3),
('Polícia Civil', 3),
('Serviço de Atendimento Móvel de Urgência', 3),
('Secretaria Municipal de Assistência Social', 3),
('Plano de Contingência para Situações de Baixas Temperaturas', 3),
('Capela de o Socorro', 3),
('Companhia de Engenharia e Tráfego', 2),
('São Paulo Transportes', 2),
('SPTRANS', 2),
('Campo Belo', 2),
('zona Sul', 2),
('Coordenador Geral de o Defesa Civil', 2),
('Programa de Prevenção Contra Incêndios em Assentamentos Precários', 2),
('Eletropaulo', 2),
('Covisa', 2),
('Ronaldo Malheiros Figueira', 2),
('Redonda', 2),
('Governo', 2),
('DOMA', 2),
('SES', 2),
('GVISAM', 2),
('Semana Interna de Prevenção de Acidentes de o Trabalho', 2),
('SIPAT', 2),
('Vila Itaim', 2),
('Coordenação de o Subprefeituras', 2),
('Centro de Gerenciamento de Emergência', 2),
('Anhembi', 2),
('Pinheiros', 2),
('Catástrofes', 2),
('Policia Militar', 2),
('ADRA', 2),
('Base Móvel de o Defesa Civil', 2),
('Abertura', 2),
('DEFESA', 2),
('Plano Preventivo', 2),
('Plano de Assistência Médica e Eventos com Múltiplas Vítimas de o Cidade de São Paulo',
2),
('Encerramento', 2),
('Intervalo', 2),
('Avenida Moreira Guimarães', 2),
('Indianópolis', 2),
('GCMs', 2),
('zona Norte', 2),
('Oeste', 2),
('Guardas Civis Metropolitanos', 2),
('Instituto de Pesquisas Tecnológicas', 2),
('Defesa Civil de Pirituba', 2),
('Defesa Civil de Santana', 2),
('Vespas', 2),
('Vila Formosa', 2),
('Formosa', 2),
('Cinemateca', 2),
('Vila Mariana', 2),
('Mata Atlântica', 2),
('Dia Municipal de o Defesa Civil', 2),
('Brasil', 2),
('Legião de o Boa', 2),
('Avenida Bandeirantes', 2),
('Viaduto Santo Amaro', 2),
('Subprefeitura de o Penha', 2),
('distrito Artur Alvim', 2),
('Cangaíba', 2),
('Vila Matilde', 2),
('Defesa Civil de o Subprefeitura de o Penha', 2),
('Cambalacho', 2),
('Bueru', 2),
('Paratigi', 2),
('Plano Preventivo de Combate a Incêndios em Assentamentos Precários', 2),
('Defesa Civil de o Subprefeitura de o Lapa', 2),
('Jaguaré', 2),
('Subprefeitura de o Lapa', 2),
('SUVIS', 2),
('Ipiranga', 2),
('IPTU', 2),
('de São Paulo', 2),
('Sapopemba', 2),
('Kombi', 2),
('Subprefeitura Butantã', 2),
('Proteção e Saúde', 2),
('Consórcio Intermunicipal Grande ABC', 2),
('Japão', 2),
('Equador', 2)]
tokens = nlp(''.join(str(seguranca_urbana_guarda_civil_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/seguranca_urbana-guarda_civil_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('GCM', 68),
('Guarda Civil Metropolitana', 42),
('Polícia Militar', 6),
('GEPAD', 6),
('Secretaria Municipal de Segurança Urbana', 6),
('SP', 5),
('Segurança Urbana', 5),
('CET', 5),
('Defesa Civil', 5),
('cidade de São Paulo', 4),
('Distrito Policial', 4),
('Zona Norte', 4),
('PM', 4),
('São Paulo', 4),
('IOPE', 4),
('Dronepol', 4),
('de São Paulo', 4),
('operação Delegada', 4),
('Guarda', 3),
('Inspetora de Agrupamento Lídia Maria de Gouvêa', 3),
('Guarda Ambiental', 3),
('Pinheiros', 3),
('Tietê', 3),
('Brás', 3),
('José Roberto Rodrigues de Oliveira', 3),
('Cidade Tiradentes', 3),
('Rolezinho', 3),
('IAMO', 3),
('AFSU', 3),
('prefeitura de São Paulo', 2),
('Praça 14 Bis', 2),
('CETEL', 2),
('Diário Oficial', 2),
('Câmara Municipal de São Paulo', 2),
('Grupos de Educação e Prevenção a o Drogas', 2),
('Marginal Segura', 2),
('Fábio Lepique', 2),
('José Roberto Oliveira', 2),
('Prefeituras Regionais', 2),
('Guardas Civis Metropolitanos', 2),
('CFSU', 2),
('Centro de Formação em Segurança Urbana', 2),
('Adelson de Souza', 2),
('João Dória', 2),
('Compromisso de Reparação de o Paisagem Urbana', 2),
('Guarda Civil Metropolitana de SP', 2),
('SMSU', 2),
('Civil', 2),
('Viaduto de o Glicério', 2),
('Sono Tranquilo', 2),
('Bruno Covas', 2),
('Prefeitura Regional', 2),
('Parque de o Ibirapuera', 2),
('Guarda Civil Metropolitana de São Paulo', 2),
('Virada Cultural', 2),
('Nova Luz', 2),
('Honda', 2),
('Praça de o Sé', 2),
('Programa', 2),
('Programa Calçada Nova', 2),
('Vila Mariana', 2),
('Inspetoria de Operações Especiais IAMO', 2),
('Lei Maria de o Penha', 2),
('Lei Municipal', 2),
('Secretaria Municipal de Políticas para o Mulheres', 2),
('SMPM', 2),
('Ministério Público', 2),
('Destacamento Náutico', 2),
('Represa de o Guarapiranga', 2),
('Taurus', 2),
('Defesa Pessoal', 2),
('GCMs', 2),
('Academia de Formação em Segurança Urbana', 2),
('ISO', 2),
('Edifício Matarazzo', 1),
('DEIC', 1),
('Programa de Proteção a o Controle de o Espaço Público', 1),
('Five Seven', 1),
('Bela Vista', 1),
('GCM 2/02/2017', 1),
('Barra Funda', 1),
('Casa Verde', 1),
('Belenzinho', 1),
('Centro', 1),
('Termos Circunstanciados', 1),
('Prefeitura de São Paulo', 1),
('Central de Telecomunicações e Videomonitoramento', 1),
('Viaduto Guadalajara', 1),
('Belém', 1),
('Inspetoria Regional de o Mooca', 1),
('Corpo Musical', 1),
('GCM 4/02/2017', 1),
('Corpo Musical de o Guarda Civil Metropolitana', 1),
('Inspetora de Divisão Geneucy Bezerra', 1),
('Subinspetor', 1),
('Davi Bastos', 1),
('CE', 1),
('Rosângela Franco', 1),
('Subinspetor Valdyr Filho', 1),
('cd', 1),
('Marcus Johnny', 1),
('Escolar', 1),
('Patrimônio', 1),
('Agentes Públicos', 1),
('Rua e Controle de o Espaço Público', 1),
('Regional de o Penha', 1),
('Coordenadoria de Ações Comunitárias', 1),
('Comando Geral', 1),
('Ações Comunitárias', 1),
('A.A.', 1),
('Alcoólicos Anônimos', 1),
('Al-Anon', 1),
('Ação Comunitária Criança sob Nossa Guarda', 1),
('Criança sob Nossa Guarda', 1),
('TOP 20', 1),
('Simpósio GREA', 1),
('Hospital de o Clínicas', 1),
('Criança sob nosso Guarda', 1),
('Lidinha', 1),
('Inspetor Superintendente', 1),
('Euclides Conradim', 1),
('Vila Iolanda', 1),
('Inspetoria Regional de Defesa Ambiental Carmo', 1),
('Rua Rio Bahia', 1),
('49º DP', 1),
('República', 1),
('Rua Campo Novo de o Sul', 1),
('Vila Andrade', 1),
('Lilás', 1),
('Metrô', 1),
('Assistência e Desenvolvimento Social', 1),
('Inspetoria Regional de Guaianases', 1),
('EMEF Professor Carlos Pasquale', 1),
('Itaim Paulista', 1),
('Inspetoria Regional de São Miguel Paulista', 1),
('50º DP', 1),
('Avenida de o Juntas Provisórias', 1),
('Heliópolis', 1),
('Grito', 1),
('SAMU', 1),
('Inspetoria Regional de o Ipiranga', 1),
('Hospital de Vila Alpina', 1),
('Pérola Byington', 1),
('Secom', 1),
('Praça de o Cultura', 1),
('Zona Leste', 1),
('Inspetor de Agrupamento Gilson Menezes', 1),
('Evandro', 1),
('Carina', 1),
('José Roberto Rodrigues', 1),
('João Doria', 1),
('Doria', 1),
('Pichadora', 1),
('Rua Santo Antônio', 1),
('Lei Cidade Linda', 1),
('Rua Benjamin Constant', 1),
('3ª Caminhada Down São Paulo', 1),
('3º Caminha Down São Paulo', 1),
('Parque Villa-Lobos', 1),
('Dia Internacional', 1),
('Down', 1),
('Projeto Simbiose', 1),
('Secretaria Municipal de o Pessoa com Deficiência', 1),
('Festival Lollapalooza', 1),
('Capital', 1),
('Lollapalooza', 1),
('Autódromo de Interlagos', 1),
('Viaduto Bernardino Tranchesi', 1),
('Hospital de o Servidor Público Municipal', 1),
('Rua Augusta', 1),
('Rua Conchita', 1),
('Vila Rosa', 1),
('GCM Ambiental Irdam Cantareira', 1),
('Coronel Arrison', 1),
('Calçada Nova', 1),
('Programa “ Calçada Nova', 1),
('Prefeitura de São Pulo', 1),
('Jardim Keralux', 1),
('Canil', 1),
('Medalha Tiradentes', 1),
('GCM Classe Especial Marcos Moraes', 1),
('Moraes', 1),
('Diploma de Reconhecimento', 1),
('Salão Nobre', 1),
('Palácio Anchieta', 1),
('polícia Militar', 1),
('Cemitério 3/04/2017', 1),
('Cemitério São Pedro', 1),
('Vila Alpina', 1),
('56º DP', 1),
('Cidade de São Paulo', 1),
('Guarda Civil Metropolitana e o Defesa Civil de São Paulo', 1),
('Dahua Technology', 1),
('PGIDB', 1),
('Prefeito João Doria', 1),
('Secretário Municipal de Segurança Urbana', 1),
('Secretário Municipal de Inovação e Tecnologia', 1),
('Daniel Annemberg', 1),
('Oziel de Souza', 1),
('Caio Miranda Carneiro', 1)]
tokens = nlp(''.join(str(seguranca_urbana_guarda_civil_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/seguranca_urbana-guarda_civil_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('GCM', 636),
('Guarda Civil Metropolitana', 247),
('Gabinete de o Secretário', 226),
('Despachos Internos', 136),
('SMSU', 117),
('Gabinete', 116),
('Secretário', 109),
('Despachos', 56),
('DBA', 54),
('São Paulo', 50),
('cidade de São Paulo', 44),
('Secretaria Municipal de Segurança Urbana', 43),
('Secretário Sexta-feira', 40),
('Guarda', 36),
('GCMs', 33),
('Santos', 30),
('Instituto', 29),
('Paz', 27),
('Roberto Porto', 26),
('Mônica Casanova', 26),
('Centro de Formação em Segurança Urbana', 26),
('Fernando Haddad', 25),
('Polícia Militar', 25),
('Guarda Ambiental', 24),
('CFSU', 24),
('Marcus Vinicius', 23),
('Distrito Policial', 23),
('Gilson Menezes', 23),
('Secretário Quinta-feira', 23),
('Secretário Segunda-feira', 23),
('Comandante Geral', 22),
('Gabinete de o Secretário 15h00', 22),
('Brasil', 21),
('Parelheiros', 21),
('CET', 20),
('Controle de o Espaço Público e Fiscalização de o Comércio Ambulante', 20),
('Itaquera', 20),
('Prefeito', 19),
('SMDHC', 19),
('Paola Bernal', 18),
('Guty', 18),
('Campanha de o Desarmamento', 18),
('Parque Ibirapuera', 17),
('Sede DBA', 17),
('Secretário Municipal de Segurança Urbana', 16),
('Segurança Urbana', 16),
('Inspetor Gilson Menezes', 16),
('Edifício Matarazzo', 15),
('SMADS', 15),
('Ari Friedenbach', 15),
('TRIOS', 15),
('Gabinete de o Secretário 17h00', 15),
('Guarda Civil', 14),
('Centro', 14),
('Dra', 14),
('Polícia Civil', 14),
('Comandante Gilson Menezes', 14),
('Ed Matarazzo', 14),
('de São Paulo', 13),
('Parque de o Ibirapuera', 13),
('Thays Librelon', 13),
('CDs', 13),
('Guardas Civis', 13),
('Casas de Mediação de Conflitos', 13),
('Guardas Civis Metropolitanos', 13),
('Comandante Geral de o Guarda Civil Metropolitana', 12),
('Gabinete de o Prefeito', 12),
('Zona Norte', 12),
('Capela de o Socorro', 12),
('Paola de Carvalho Bernal', 12),
('Câmara Municipal', 12),
('Comando Geral de', 12),
('Viaduto de o Chá', 12),
('IOPE', 12),
('Imprensa', 12),
('Gabinete de o Secretário 16h00', 12),
('Eduardo de Siqueira Bias', 11),
('SP', 11),
('Anhembi', 11),
('Casas de Mediação', 11),
('Perus', 11),
('Coral', 11),
('Itaim Paulista', 11),
('Inspetoria Regional', 11),
('Zona Leste', 11),
('SMSU : Foto', 11),
('Canil', 11),
('Ministério de o Justiça', 11),
('Ulisses', 11),
('Braços Abertos', 11),
('Classes Distintas', 11),
('Coordenação DBA', 11),
('Vale de o Anhangabaú', 10),
('Segurança Pública', 10),
('Central', 10),
('Jaraguá', 10),
('Santana', 10),
('Superintendente de Planejamento', 10),
('Avenida Paulista', 10),
('Ministério Público', 10),
('Corregedor', 10),
('Gabinete de o Secretário 14h00', 10),
('Sul', 9),
('cidade de', 9),
('Gabinete de Gestão Integrada', 9),
('Governo Federal', 9),
('Pinheiros', 9),
('Santo Amaro', 9),
('Guarda Civil Metropolitana Ambiental', 9),
('Pacaembu', 9),
('Programa', 9),
('Vila Mariana', 9),
('Exército Brasileiro', 9),
('Rua Líbero Badaró', 9),
('Inspetor de Divisão Gilson Menezes', 9),
('Benedito Mariano', 9),
('SPTrans', 8),
('prefeitura de São Paulo', 8),
('Classe Distinta', 8),
('Tremembé', 8),
('GCM Ambiental', 8),
('Inspetoria', 8),
('Coronel Telhada', 8),
('Comandante Regional', 8),
('Mooca', 8),
('Bom Retiro', 8),
('Butantã', 8),
('São Miguel Paulista', 8),
('Superintendente de Operações', 8),
('Menezes', 8),
('Inspetor Vanderlei', 8),
('Inspetorias', 7),
('Leste', 7),
('Lei', 7),
('Sé', 7),
('Praça Roosevelt', 7),
('Subprefeitura de o Sé', 7),
('Central de Telecomunicações e Videomonitoramento', 7),
('Banda', 7),
('Comandante Operacional Leste', 7),
('Davi Bastos de o Santos', 7),
('Subprefeituras', 7),
('Corra', 7),
('Programa de Proteção Ambiental', 7),
('DVDs', 7),
('Pirituba', 7),
('Câmara Municipal de São Paulo', 7),
('estado de São Paulo', 7),
('Direitos Humanos', 7),
('Nova Luz', 7),
('Cidade Ademar', 7),
('Vila Maria', 7),
('São Mateus', 7),
('Complexo Prates', 7),
('ONU', 7),
('GGI', 7),
('GEVID', 7),
('Guardiã Maria de o Penha', 7),
('SECOM', 7),
('USP', 7),
('SDTE', 7),
('Joel Malta de Sá', 6),
('Haddad', 6),
('Inspetoria de Operações Especiais', 6),
('Guardas', 6),
('Crack', 6),
('Capital', 6),
('polícia Militar e Civil', 6),
('Decreto', 6),
('Coral de', 6),
('Ibirapuera', 6),
('Comandante Operacional Norte', 6),
('Carina Regina Malfa Marote', 6),
('Cidade de São Paulo', 6),
('Campanha de o Agasalho 2013', 6),
('Consolação', 6),
('Lapa', 6),
('Casa de Mediação', 6),
('Inspetores', 6),
('Direitos Humanos e Cidadania', 6),
('PM', 6),
('Comandante Menezes', 6),
('Vanderlei Bento Barbosa', 6),
('Inspetora Sandra Perticarrari', 6),
('Inspetora Lindamir Magalhães de Almeida', 6),
('Casa de Atenção', 6),
('Inspetor Vanderlei Bento Barbosa', 6),
('Inspetora Sandra Helena Perticarrari', 6),
('Cel', 6),
('Faculdade Zumbi de o Palmares', 6),
('Bairro', 6),
('Rua Libero Badaró', 6),
('Gabriela', 6),
('Programa de Braços', 6),
('Gabinete de o Secretário 17h30', 6),
('Despachos Internos Local: Gabinete de o Secretário', 6),
('Nádia Campeão', 5),
('Comando de o GCM', 5),
('Corpo de Bombeiros', 5),
('Banda de', 5)]
tokens = nlp(''.join(str(subprefeituras_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/subprefeituras_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('Tapa Buraco', 428),
('Penha', 415),
('Prefeitura Regional Penha', 341),
('Cidade Tiradentes', 306),
('Bruno Covas', 230),
('Prefeitura Regional Cidade Tiradentes', 220),
('Vila Guilherme', 219),
('Itaquera', 213),
('São Paulo', 197),
('SP', 174),
('Mutirão Mario Covas', 172),
('São Mateus', 170),
('Pinheiros', 169),
('Ermelino Matarazzo', 169),
('Vila Maria', 167),
('Vila prudente', 134),
('Vila Mariana', 133),
('Ipiranga', 130),
('Prefeitura Regional Itaquera', 128),
('Santo Amaro', 124),
('Jabaquara', 117),
('Lapa', 116),
('Cidade Ademar', 104),
('Aricanduva', 102),
('Prefeitura de São Paulo', 101),
('Butantã', 99),
('Sé', 98),
('Prefeitura Regional Ermelino Matarazzo', 98),
('prefeitura de São Paulo', 96),
('CET', 92),
('Prefeituras Regionais', 91),
('Perus', 90),
('Prefeitura Regional Vila Maria', 88),
('Capela de o Socorro', 86),
('Pirituba', 84),
('Itaim Paulista', 81),
('Prefeitura Regional São Mateus', 79),
('Calçada Nova', 77),
('Campo Limpo', 77),
('cidade de São Paulo', 75),
('Brasilândia', 75),
('Mooca', 74),
('Cidade Linda', 73),
('Programa Calçada Nova', 72),
('Prefeitura Regional Jabaquara', 72),
('Secretaria Especial de Comunicação', 69),
('São Miguel Paulista', 68),
('Parelheiros', 67),
('Prefeitura Regional Vila prudente', 66),
('SP Cidade Linda', 61),
('Guaianases', 61),
('João Doria', 59),
('Brasil', 58),
('Prefeitura Regional', 57),
('Secretaria de o Prefeituras Regionais', 57),
('Subprefeituras', 57),
('Amlurb', 56),
('GCM', 55),
('Santana', 52),
('Sapopemba', 52),
('Sabesp', 51),
('Autoridade Municipal de Limpeza Urbana', 51),
('Prefeitura Regional Cidade Ademar', 51),
('Mutirão Mário Covas', 49),
('de São Paulo', 49),
('Centro', 48),
('Zona Leste', 48),
('Guarda Civil Metropolitana', 47),
('Obras', 45),
('Prefeitura Regional Ipiranga', 45),
('Cidade', 44),
('Praça de Atendimento', 44),
('SP156', 43),
('Casa Verde', 42),
('Regionais', 41),
('Tucuruvi', 41),
('AMLURB', 41),
('Jaçanã', 41),
('Tremembé', 41),
('Mutirão', 40),
('Companhia de Engenharia de Tráfego', 39),
('M’Boi Mirim', 38),
('prefeitura Regionais', 38),
('Cooperação', 38),
('Asfalto Novo', 38),
('Carnaval de Rua', 38),
('Prefeito Regional', 37),
('Zona Sul', 37),
('Interlagos', 37),
('RG', 36),
('Prefeitura Regional Pinheiros', 36),
('Prefeitura Regional Vila Mariana', 35),
('Adote um Praça', 35),
("M'Boi Mirim", 35),
('TERMO de COOPERAÇÃO', 34),
('Prefeitura Regional Capela de o Socorro', 33),
('SPTrans', 32),
('Largo Piraporinha', 31),
('Freguesia de o ó', 31),
('M’ Boi Mirim', 31),
('Mário Covas', 30),
('São Miguel', 30),
('Vila Albertina', 30),
('Prefeitura Regional Sé', 29),
('Zona Norte', 29),
('Raposo Tavares', 29),
('Prefeitura Regional Mooca', 29),
('Secretaria Municipal de o Subprefeituras', 29),
('Jaraguá', 28),
('Freguesia', 27),
('Decreto', 27),
('Capão Redondo', 27),
('João Dória', 26),
('Secretaria Municipal de o Pessoa com Deficiência', 26),
('Governo', 26),
('SECOM', 26),
('Termos de Cooperação', 26),
('Bairros', 26),
('Secretaria de Prefeituras Regionais', 25),
('Secretário de o Prefeituras Regionais', 25),
('Eduardo Odloak', 25),
('Secretaria Municipal de Assistência e Desenvolvimento Social', 25),
('prefeitura Regional', 25),
('Lei Cidade Limpa', 25),
('PLACAS', 25),
('Tatuapé', 25),
('Prefeitura Regional Aricanduva', 25),
('Prefeitura Regional Campo Limpo', 25),
('Radial Leste', 25),
('SMADS', 25),
('SMPED', 24),
('Polícia Militar', 24),
('Avenida de o Metalúrgicos', 24),
('PR-PI', 24),
('Segurança Urbana', 23),
('Prefeito João Doria', 23),
('cidade de', 23),
('Alexandre Modonezi', 23),
('Zona Oeste', 22),
('Anhembi', 22),
('R', 22),
("Prefeitura Regional M'Boi Mirim", 22),
('Verde e Meio Ambiente', 21),
('Secretaria Municipal de o Prefeituras Regionais', 21),
('Cohab', 21),
('Vila Nova Cachoeirinha', 21),
('Cachoeirinha', 20),
('Departamento de Iluminação Pública', 20),
('Avenida Pacaembu', 20),
('Itaim Bibi', 20),
('Descomplica SP', 20),
('Subprefeitura', 20),
('São Paulo Cidade Linda', 19),
('Prefeitura Regional Butantã', 19),
('Paulo Mathias', 19),
('SPUA', 19),
('Bairro Lindo', 19),
('AV', 19),
('Assistência e Desenvolvimento Social', 19),
('Avenida 23 de Maio', 18),
('Infraestrutura', 18),
('Capital', 18),
('Largo de o Batata', 18),
('Prefeitura Regional São Miguel', 18),
('Ecopontos', 18),
('CGE', 17),
('Transportes e Mobilidade', 17),
('Avenida de o Estado', 17),
('Covas', 17),
('ILUME', 17),
('ONGs', 17),
('Rua', 17),
('Subprefeitura Campo Limpo', 17),
('SMSUB', 17),
('Praça', 16),
('Avenida Paulista', 16),
('Praça de o Sé', 16),
('Prefeitura Regional Itaim Paulista', 16),
('Prefeitura Regional Lapa', 16),
('Mandaqui', 16),
('Programa Asfalto Novo', 16),
('Assistência Social', 16),
('Cohab-SP', 16),
('Prefeitura Regional Perus', 16),
('Formação Básica para Catadores em Materiais', 16),
('Líbano', 15),
('Prefeitura Regional Freguesia', 15),
('Praça de o República', 15),
('Meio Ambiente', 15),
('Carnaval', 15),
('Programa', 15),
('Jardim de o Pedras', 15),
('Anhangabaú', 15),
('Carnaval de Rua de São Paulo', 15),
('Ônibus Lilás', 15),
('Subprefeitura Guaianases', 15),
('Mutirão Grandes Corredores', 15),
('Prefeito João Dória', 14),
('bairro de São Paulo', 14),
('Mario Covas', 14)]
tokens = nlp(''.join(str(urbanismo_doria_covas.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/urbanismo_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('SMUL', 226),
('São Paulo', 91),
('PIU', 85),
('Secretaria Municipal de Urbanismo e Licenciamento', 83),
('Heloisa M. Salles Penteado Proença', 79),
('SP', 71),
('Gestão Urbana', 62),
('Prefeito João Doria', 61),
('Prefeitura de São Paulo', 59),
('Projeto de Intervenção Urbana', 53),
('GeoSampa', 49),
('SP-Urbanismo', 49),
('Plano diretor Estratégico', 40),
('PDE', 38),
('prefeitura de São Paulo', 38),
('Secretário', 35),
('SP Urbanismo', 34),
('Governo', 33),
('Bruno Covas', 32),
('de São Paulo', 32),
('Plano', 32),
('Lei de Zoneamento', 31),
('PRE', 31),
('cidade de São Paulo', 26),
('Câmara Municipal', 26),
('Projeto de Lei', 26),
('Pontos', 26),
('Parque Augusta', 25),
('Heloisa Proença', 25),
('CPPU', 25),
('CMPU', 24),
('Anhembi', 22),
('São Paulo Urbanismo', 22),
('José Armênio', 21),
('Prefeito Bruno Covas', 21),
('ObservaSampa', 21),
('OUCAB', 21),
('Arco Jurubatuba', 21),
('Despachos', 20),
('SEHAB', 20),
('Claudio Bernardes', 20),
('Lei', 20),
('Heloisa M. Salles Penteado Proença Terça-Feira', 19),
('SMSO', 19),
('Aprova Rápido', 19),
('Villa lobo', 19),
('SMT', 18),
('Heloisa M. Salles Penteado Proença Quinta-Feira', 18),
('SVMA', 18),
('ZOE', 18),
('CEAGESP', 17),
('Edifício Martinelli', 17),
('PL', 17),
('SMDU', 17),
('Heloisa M. Salles Penteado Proença Quarta-Feira', 16),
('Secretaria Municipal de Urbanismo', 16),
('Centro', 16),
('Brasil', 16),
('Secretaria Municipal de Desenvolvimento Urbano', 16),
('Parelheiros', 16),
('PIUs', 16),
('SECOM', 15),
('Água Branca', 15),
('SMIT', 15),
('COE', 15),
('HIS', 15),
('Campo Limpo', 15),
('Consorciada Água Branca', 15),
('Geoinfo', 15),
('Marcos Penido', 14),
('Programa de Metas', 14),
('Ministério Público', 14),
('Urbanismo', 14),
('Conselho Municipal de Política Urbana', 14),
('Decreto', 14),
('Santo Amaro', 14),
('PIU Vila Leopoldina', 14),
('Vila Leopoldina', 14),
('Informe Urbano', 14),
('Setor Central', 14),
('Secretário Sexta-feira', 14),
('Heloisa M. Salles Penteado Proença Sexta-Feira', 13),
('Licenciamento', 13),
('Cidade', 13),
('operação Urbana', 13),
('Mauro Ricardo', 13),
('Gestão', 12),
('João Doria', 12),
('Habitação de Interesse Social', 12),
('CEPACs', 12),
('SIURB', 12),
('SMADS', 11),
('Heloisa M. Salles Penteado Proença Sexta-feira', 11),
('Projetos de Intervenção Urbana', 11),
('Lei de Parcelamento , Uso e Ocupação de o Solo', 11),
('PDUI', 11),
('Coordenadoria de Produção e Análise de Informação', 11),
('SMUL-GAB', 11),
('PIU Setor Central', 11),
('Jaime Lerner', 10),
('Inovação e Tecnologia', 10),
('Daniel Annenberg', 10),
('Secovi', 10),
('Arq', 10),
('Prefeituras Regionais', 10),
('América Latina', 10),
('CET', 10),
('Grupo de Gestão', 10),
('Natal', 10),
('IDH-M', 10),
('Projeto', 10),
('Zona de Ocupação Especial', 10),
('Carlos Leite', 9),
('Prefeito', 9),
('Leonardo Castro', 9),
('Geosampa', 9),
('Secretaria Especial de Comunicação', 9),
('Gabinete de o Prefeito', 9),
('LPUOS', 9),
('Operações Urbanas', 9),
('UBS', 9),
('operação Urbana Centro', 9),
('PDF', 9),
('Pública', 9),
('Programa de Interesse Público', 9),
('Mooca', 9),
('Arco Pinheiros', 9),
('Escola de o Cidade', 9),
('Ana Santos', 9),
('Gilberto Natalini', 8),
('Justiça', 8),
('Prefeito João Dória', 8),
('Secretariado', 8),
('Redenção', 8),
('Despacho Interno', 8),
('Sérgio Avelleda', 8),
('PRODAM', 8),
('SGM', 8),
('Prof', 8),
('Fernando Chucre', 8),
('Wilson Poit', 8),
('Programa de Metas 2017-2020', 8),
('Poder Público', 8),
('PMI', 8),
('Sé', 8),
('Consorciada Faria Lima', 8),
('Código de Obras e Edificações', 8),
('Plano diretor Estratégico – PDE', 8),
('Jurubatuba', 8),
('Zonas Especiais de Interesse Social', 8),
('Secretaria Municipal de Desestatização e Parcerias', 8),
('PPMI', 8),
('Ana', 8),
('Conselho gestor de Desenvolvimento Urbano', 7),
('SP Urb', 7),
('Paulo Frange', 7),
('OUC', 7),
('Largo de o Arouche', 7),
('Pinheiros', 7),
('Desenvolvimento Urbano', 7),
('Despacho', 7),
('IBGE', 7),
('José Armênio de Brito Cruz', 7),
('SMDP', 7),
('Rio Tietê', 7),
('estado de São Paulo', 7),
('Faria Lima', 7),
('Lei Municipal', 7),
('Diário Oficial', 7),
('Mayors Challenge 2016', 7),
('Praça Roosevelt', 7),
('Medellín', 7),
('Comissão de Proteção a o Paisagem Urbana', 7),
('Bloomberg Philantropies', 7),
('Caribe', 7),
('Educação', 7),
('Prefeitura Regional de o Lapa', 7),
('Jaguaré', 7),
('Grajaú', 7),
('Igreja Universal', 7),
('Secretário Quinta-feira', 7),
('Parque minhocão', 7),
('Secretário Vitor Aly', 7),
('Secretário Segunda-feira', 7),
('Marcelo Terra', 6),
('Claudio Carvalho', 6),
('Secretários Marcos Penido', 6),
('Paulo Uebel', 6),
('SMSU', 6),
('Ricardo Yazbek', 6),
('Distrito', 6),
('cidade de', 6),
('Liberdade', 6),
('Vila Andrade', 6),
('SMPR', 6),
('DPH', 6),
('Centro Novo', 6),
('Região Metropolitana de São Paulo', 6),
('Governo de o Estado', 6),
('Parhis', 6)]
tokens = nlp(''.join(str(urbanismo_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/urbanismo_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('Secretário Fernando de Mello Franco', 263),
('SMDU', 253),
('SP Urbanismo', 192),
('Fernando Haddad', 180),
('Secretário Fernando de Mello Franco Quinta-feira', 131),
('PDE', 130),
('SGM', 121),
('Secretário Fernando de Mello Franco Segunda-feira', 121),
('Secretário Fernando de Mello Franco Sexta-feira', 108),
('Prefeito Fernando Haddad', 104),
('Gustavo Partezani', 101),
('SNJ', 92),
('São Paulo', 89),
('Arco Tietê', 74),
('Secretaria Municipal de Desenvolvimento Urbano', 72),
('Prefeito', 71),
('CMPU', 67),
('Marcos Cruz', 66),
('Plano diretor Estratégico', 64),
('Secretário', 64),
('Luis Massonetto', 63),
('SEHAB', 59),
('SEMPLA', 59),
('Despachos', 55),
('Fernando de Mello Franco', 52),
('Chico Macena', 49),
('Finanças', 49),
('SMSP', 48),
('Leda Paulani', 48),
('Despachos Internos', 48),
('SIURB', 47),
('SMT', 46),
('SP', 41),
('SMC', 40),
('SF', 40),
('SMRIF', 40),
('Jilmar Tatto', 38),
('SEL', 38),
('Nabil Bonduki', 36),
('FUNDURB', 34),
('Rua São Bento', 33),
('de São Paulo', 32),
('reunião de Diretoria', 32),
('CPPU', 32),
('SVMA', 31),
('PMSP', 30),
('Plano', 30),
('Diário Oficial', 30),
('José Floriano', 30),
('OUCAB', 30),
('Edifício Martinelli', 29),
('Prefeito Haddad', 29),
('Secretários Chico Macena', 29),
('Conselho Municipal de Política Urbana', 28),
('Weber Sutti', 28),
('reunião Interna', 27),
('cidade de São Paulo', 26),
('Consorciada Água Branca', 26),
('Grupo de Gestão', 25),
('SECOM', 22),
('SMRG', 22),
('prefeitura de São Paulo', 21),
('Conselho de Administração de o SP Urbanismo', 21),
('Paula Motta', 21),
('Roberto Garibe', 21),
('Cidade', 20),
('CET', 20),
('Prefeitura de São Paulo', 20),
('Arco de o Futuro', 19),
('Água Branca', 19),
('Fundo de Desenvolvimento Urbano', 19),
('Comissão', 18),
('Almoço', 18),
('Brasil', 18),
('Ricardo Teixeira', 16),
('Leonardo Barchini', 16),
('SERG', 15),
('Secovi', 15),
('Secretário Marcos Cruz', 15),
('Secretários Antônio Donato', 15),
('Daniel Montandon', 15),
('Edital 2', 15),
('Gabinete', 14),
('Marcelo Ignatios', 14),
('Cidade de São Paulo', 14),
('Wilson Poit', 14),
('USP', 14),
('Nunzio Briguglio', 14),
('Vicente Trevas', 14),
('operação Urbana', 13),
('Pirituba', 13),
('Fundo', 13),
('Comissão de Proteção a o Paisagem Urbana', 13),
('Colômbia', 13),
('Antônio Donato', 13),
('Vila Carioca', 13),
('Territórios CEU', 13),
('Juca Ferreira', 13),
('Paulo Frateschi', 13),
('Arq', 13),
('PDUI', 13),
('Ordinária de o Conselho Municipal de Política Urbana', 12),
('Srs', 12),
('Mooca', 12),
('Fernando de Mello Franco Segunda-feira', 12),
('Barra Funda', 12),
('Tereza Herling', 12),
('Paula Tinoco', 12),
('Centro', 11),
('Gestão Urbana SP', 11),
('S.F.', 11),
('Vila prudente', 11),
('DEINFO', 11),
('Audiência Pública', 11),
('Cerimônia', 11),
('Grupo gestor', 11),
('Plano de Desenvolvimento Urbano Integrado', 11),
('Feira', 11),
('Haddad', 10),
('Mello Franco', 10),
('Lei', 10),
('Município de São Paulo', 10),
('Metrô', 10),
('Gestão Urbana', 10),
('Santo Amaro', 10),
('Medellín', 10),
('Osvaldo Spuri', 10),
('CEUs', 10),
('SMADS', 10),
('SDTE', 10),
('SME', 10),
('Celso Jatene', 10),
('SEME', 10),
('DEUSO', 10),
('Palestra', 10),
('Consorciada Mooca', 10),
('6ª Conferência Municipal de o Cidades', 9),
('DEURB', 9),
('Urbano', 9),
('Extraordinária de o Conselho Municipal de Política Urbana', 9),
('Santana', 9),
('Freguesia de o ó', 9),
('Perus', 9),
('Ipiranga', 9),
('Departamento de Produção e Análise de Informação', 9),
('João Antônio', 9),
('IPEA', 9),
('Fernando de Mello Franco Sexta-feira', 9),
('Luis Massonetto(SNJ', 9),
('Secretários Marcos Cruz', 9),
('Concurso Nacional Ensaios Urbanos', 9),
('Subprefeitura de o Lapa', 9),
('ZPI', 9),
('Anexo II', 8),
('PMI', 8),
('Vila Maria', 8),
('Seminário', 8),
('PL', 8),
('estado de São Paulo', 8),
('Governo', 8),
('Câmara Municipal', 8),
('Dr. Gustavo Partezani', 8),
('Jurídicos', 8),
('X Bienal de Arquitetura de São Paulo', 8),
('Luiz Massonetto', 8),
('Prof', 8),
('Nádia Campeão', 8),
('IPTU', 8),
('Fernando de Mello Franco Quinta-feira', 8),
('Secretário Leonardo Barchini', 8),
('Plano Municipal de Mobilidade Urbana', 8),
('Simão Pedro', 8),
('Wanderley Meira', 8),
('DGPI', 8),
('Despacho', 8),
('Prefeitura Municipal de São Paulo', 7),
('Habitação', 7),
('5ª Conferência Nacional de o Cidades', 7),
('Conferência Nacional', 7),
('Ministério de o Cidades', 7),
('Ata', 7),
('Obras', 7),
('Centro de São Paulo', 7),
('Projetos Urbanos', 7),
('Projeto de Lei', 7),
('Secretarias', 7),
('Secretário Municipal de Desenvolvimento Urbano', 7),
('Zona Leste', 7),
('Campo Limpo', 7),
('Câmara Municipal de São Paulo', 7),
('Vila Mariana', 7),
('Diretoria', 7),
('Jaraguá', 7),
('Capela de o Socorro', 7),
('Parelheiros', 7),
('Luciana Temer', 7),
('Instituto de Pesquisa Econômica Aplicada', 7),
('SMSU', 7),
('Carolina Heldt', 7),
('CMTT', 7)]
tokens = nlp(''.join(str(desenvolvimento_haddad.clean_lem.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/desenvolvimento_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
[('sdte', 3034),
('cat', 862),
('artur henrique', 414),
('r r', 299),
('mei', 230),
('tecnico', 223),
('rg cpf', 210),
('brasil', 208),
('sp gov br', 197),
('sp', 195),
('fernando haddad', 167),
('cat movel', 152),
('rg', 146),
('cate', 146),
('andrea garbim', 123),
('municipe', 120),
('eliseu gabriel', 120),
('cat rg cpf', 113),
('pronatec', 107),
('cristina braga', 105),
('solidario', 103),
('tec', 100),
('cats', 93),
('mercadao', 91),
('murilo carini', 85),
('praca republica', 83),
('sdte youtube', 82),
('damaris rodrigues', 80),
('cat luz', 65),
('secretario artur henrique', 64),
('semte', 61),
('solange borges', 61),
('viviane claudino', 54),
('itaquera', 53),
('italia', 53),
('cate movel', 53),
('haddad', 52),
('solange', 48),
('sebrae', 46),
('oit', 46),
('artur', 45),
('itaim paulista', 44),
('r', 44),
('penha mateus i miguel paulista santana luz', 43),
('cnpj', 43),
('bruna eleis', 43),
('play store', 43),
('tambem', 40),
('avenida prestes maia', 39),
('jabaquara interlagos', 37),
('h h', 37),
('balcao', 37),
('pirituba', 36),
('mao', 36),
('lapa', 36),
('america', 35),
('ade sampa', 34),
('ipiranga', 34),
('cmct i', 33),
('nadia campeao', 33),
('tiradentes', 33),
('sapopemba', 33),
('mei movel', 33),
('cat sistema android', 33),
('gestao', 31),
('praca', 30),
('usp', 30),
('mateus', 29),
('brasilia', 29),
('SS', 28),
('miguel paulista', 27),
('medio', 27),
('vila maria', 27),
('rua cantareira', 27),
('periodo', 26),
('santo amaro', 26),
('cipa', 26),
('av marechal tito cate luz', 25),
('vila formosa', 24),
('sebrae sp', 23),
('funcionario', 23),
('ubs', 23),
('marcelo mazeta', 23),
('interanutri', 23),
('regiao', 22),
('camara', 22),
('av prestes maia', 22),
('jaragua', 21),
('vila prudente', 21),
('forum', 21),
('adesampa', 21),
('david', 20),
('diario', 20),
('penha', 20),
('graca', 20),
('fundatec', 20),
('garcom', 19),
('brasilandia', 19),
('vila mariana', 19),
('mutirao', 19),
('aline oliveira proximo', 19),
('av marechal tito cat itaquera', 19),
('subprefeitura penha cat pirituba rua dr felipe pinel cat santana', 19),
('sesc', 19),
('cat santana', 18),
('tecnico cat', 18),
('borges', 18),
('cat itaim', 18),
('onu', 18),
('sergio miletto', 18),
('ademar interlagos', 18),
('cat itaquera', 17),
('cracolandia', 17),
('aline oliveira', 17),
('miguel', 17),
('dasn simei', 17),
('comusan sp', 17),
('augusto carlos bauman cate itaim', 17),
('av marechal tito cate jabaquara av eng', 17),
('arruda pereira cate luz', 17),
('sus', 17),
('danilo', 17),
('proximo', 16),
('negocio', 16),
('fundetec', 16),
('cat salario', 16),
('temporario', 16),
('usp singer brasil', 16),
('pre', 16),
('augusto carlos bauman cat lapa', 16),
('eduardo suplicy', 16),
('sp gov', 16),
('denise motta dau', 16),
('dr felipe pinel cate interlagos av interlagos cate perus', 16),
('cate itaim', 16),
('r solange borges', 15),
('cat solange', 15),
('ministerio', 15),
('escritorio', 15),
('instituto butantan', 15),
('subprefeitura itaim paulista', 15),
('internet', 15),
('avenida joao', 15),
('imprensasdte sp gov br ate h', 15),
('cate eletronico', 15),
('sesc carmo', 15),
('jose alexandre sanches', 14),
('setimo', 14),
('smads', 14),
('senai sebrae', 14),
('ermelino matarazzo', 14),
('morro doce', 14),
('casa verde', 14),
('seminario', 14),
('luiz barbosa', 14),
('tecnico cate', 14),
('damaris rodrigues proximo', 14),
('augusto carlos bauman cate', 14),
('apaf', 13),
('sescon sp', 13),
('rogerio sottili', 13),
('universidade anhanguera', 13),
('campo limpo', 13),
('merenna', 13),
('joao moura', 13),
('sdte rede', 13),
('mes', 12),
('ceu alto', 12),
('camara municipal', 12),
('arena corinthians', 12),
('ceu campo limpo', 12),
('agencia sp', 12),
('ong', 12),
('av marechal tito penha rua candapui mateus i av mateo', 12),
('cambuci', 12),
('guarapiranga', 12),
('comunitaria policia militar', 12),
('avenida paulista', 12),
('secom', 12),
('italia merenna', 12),
('jaguare', 12),
('rua gastao madeira', 12),
('sms sgm', 12),
('danilo guerra proximo', 12),
('praca novo', 11),
('secretario', 11),
('lanchonete', 11),
('edicao', 11),
('sescon', 11),
('arruda pereira', 11),
('carandiru', 11),
('perus', 11),
('fiesp', 11),
('republica', 11),
('avenida sapopemba', 11),
('rua delsuc alves magalhaes', 11),
('servico cat', 11),
('jabaquara luz', 11),
('jose trevisol', 11),
('smdhc', 11)]
tokens = nlp(''.join(str(esportes_haddad.clean_lem.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/assistencia_social_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
[('brasil', 373),
('seme', 357),
('tecnico', 178),
('celso jatene', 165),
('pacaembu', 153),
('vanessa dini', 134),
('cotp', 132),
('sp', 126),
('juliana salles jsalles sp gov br', 126),
('tiete', 117),
('sp gov br', 108),
('itaquera', 90),
('olimpico', 90),
('estadio pacaembu', 89),
('campeonato brasileiro', 87),
('rafael silva raaugusto', 83),
('francisco pinheiro fbpinheiro', 79),
('tambem', 77),
('campeonato paulista', 75),
('stephanie frasson', 73),
('ibirapuera', 68),
('manchester', 67),
('leandro olovics', 64),
('mooca', 62),
('sbffranco', 62),
('tatuape', 60),
('ricardo monzillo', 60),
('ludmilla florencio ljflorencio', 58),
('corinthians', 57),
('centro olimpico', 56),
('juliana salles jsalles sp', 55),
('rmonzillo sp gov br', 55),
('laoalves', 55),
('renata simond', 52),
('juliana', 52),
('pirituba', 51),
('juliana salles', 50),
('jose bonifacio', 50),
('cdc', 49),
('ademar', 49),
('fernando haddad', 48),
('federacao paulista', 48),
('ipiranga', 48),
('mexico', 47),
('lucas bouzon lgpbouzon', 46),
('parque ibirapuera', 45),
('mie nishi', 44),
('estados unidos', 44),
('santo amaro', 43),
('guilherme guidetti gguidetti', 43),
('francisco pinheiro', 42),
('fabiana rosa', 41),
('periodo', 40),
('so', 38),
('ce', 38),
('ceret', 38),
('vitoria', 37),
('japao', 37),
('parque carmo', 37),
('jose lorenzo messina', 37),
('juventus', 36),
('jsalles', 36),
('tai chi chuan', 35),
('ginasio', 34),
('gervino pantar', 33),
('america', 33),
('vila maria', 33),
('vila mariana', 33),
('ludmilla florencio ljflorencio sp', 33),
('copa', 32),
('ana paula silva', 32),
('ricardo monzillo rmonzillo sp gov br', 31),
('congresso tecnico', 30),
('lapa', 30),
('praca charles miller', 30),
('rg', 30),
('lucas mariano lucasmariano sp', 30),
('funcionario', 28),
('vdini sp gov br', 28),
('santa catarina', 28),
('cdc maria felizarda', 28),
('vila prudente', 28),
('campea', 27),
('olimpiadas', 27),
('municipe', 27),
('frosasilva sp gov', 27),
('kung fu', 26),
('thomaz ayub', 26),
('chile', 26),
('willian barbosa', 26),
('crianca', 25),
('ce tiete', 25),
('jogos olimpicos', 24),
('super', 24),
('usp', 24),
('jack marin', 24),
('mateus', 24),
('lilian pacheco', 24),
('messias', 23),
('campeao', 23),
('jose', 23),
('podio', 23),
('mackenzie', 23),
('tiradentes', 23),
('sesc', 23),
('daniel alves', 23),
('guarapiranga', 22),
('santos', 22),
('rua pedro toledo', 22),
('butanta', 22),
('h h', 22),
('brasilandia', 22),
('aricanduva', 22),
('itaim paulista', 22),
('pirituba jaragua', 22),
('frosasilva sp gov br', 22),
('dalves', 22),
('jatene', 21),
('paixao', 21),
('jose campos', 21),
('cotp centro olimpico', 21),
('sapopemba', 21),
('iii lei', 21),
('rafael silva', 20),
('cdc guarapiranga', 20),
('raul tabajara', 20),
('chines', 19),
('emily lima', 19),
('avenida ibirapuera', 19),
('vila clementino', 19),
('dineia cardoso', 19),
('inumero', 19),
('thai', 19),
('jacana tremembe', 19),
('joerg bruder', 18),
('ce tatuape', 18),
('ceu jambeiro', 18),
('australia', 18),
('carlinhos araujo acaraujo', 18),
('ruan', 18),
('tao', 17),
('campeonato mundial', 17),
('sub', 17),
('verao', 17),
('pre', 17),
('vila guarani', 17),
('tiger', 17),
('ginasio pacaembu', 17),
('arena', 17),
('palmeiras', 16),
('internet', 16),
('mae', 16),
('jiu jitsu', 16),
('mao', 16),
('colombia', 16),
('copa mundo', 16),
('vila manchester', 16),
('leandro olovics laoalves', 16),
('davi', 16),
('daniel alves dalves sp gov br', 16),
('perus', 15),
('pelezao', 15),
('vinicius', 15),
('ricardo monzillo rmonzillo', 15),
('ce pirituba', 15),
('ce lapa', 15),
('modelodromo', 15),
('andreia', 15),
('estella gomes ecgomes', 15),
('mariane barbosa', 15),
('taquari', 14),
('av ibirapuera', 14),
('proximo', 14),
('estadio municipal machado carvalho', 14),
('jungle fight', 14),
('adeco', 14),
('palestra', 14),
('monte serrat', 14),
('auditorio centro olimpico', 14),
('masp', 14),
('sub sub', 14),
('franklin', 14),
('kaka', 14),
('copa sp', 14),
('carlinhos araujo acaraujo sp', 14),
('marianeoliveira', 14),
('viii', 14),
('vila formosa', 13),
('carlos', 13),
('lucas bouzon', 13),
('federacao', 13),
('luiz sales', 13),
('cbf', 13),
('idolo', 13),
('moema', 13),
('andreia bandeira', 13),
('parque ecologico tiete', 13),
('greco', 13),
('holanda', 13),
('rua javari', 13)]
# Faltam essas tabelas
#big tables
#saude doria
#habitacao doria
#meio ambiente doria
#urbanismo doria
#desenvolvimento_haddad
#subprefeituras_haddad
# Impossible
# Transporte Doria e Haddad
#saude - haddad e doria
#esportes haddad
#desenvolvimento haddad e doria
tokens = nlp(''.join(str(capitalsp_haddad.lemma.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/capitalsp_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-49-d147e1f0909e> in <module> ----> 1 tokens = nlp(''.join(str(capitalsp_haddad.clean_lem.tolist()))) 2 items = [x.text for x in tokens.ents] 3 entities110 = Counter(items).most_common(200) 4 with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/capitalsp_haddad.txt", "w") as output: 5 output.write(str(entities110)) ~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\spacy\language.py in __call__(self, text, disable, component_cfg) 435 DOCS: https://spacy.io/api/language#call 436 """ --> 437 doc = self.make_doc(text) 438 if component_cfg is None: 439 component_cfg = {} ~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\spacy\language.py in make_doc(self, text) 462 def make_doc(self, text): 463 if len(text) > self.max_length: --> 464 raise ValueError( 465 Errors.E088.format(length=len(text), max_length=self.max_length) 466 ) ValueError: [E088] Text of length 8347067 exceeds maximum of 3174482. The v2.x parser and NER models require roughly 1GB of temporary memory per 100,000 characters in the input. This means long texts may cause memory allocation errors. If you're not using the parser or NER, it's probably safe to increase the `nlp.max_length` limit. The limit is in number of characters, so you can check whether your inputs are too long by checking `len(text)`.
tokens = nlp(''.join(str(saude_haddad.clean_lem.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/saude_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-52-b512cec538bd> in <module> ----> 1 tokens = nlp(''.join(str(saude_haddad.clean_lem.tolist()))) 2 items = [x.text for x in tokens.ents] 3 entities110 = Counter(items).most_common(200) 4 with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/saude_haddad.txt", "w") as output: 5 output.write(str(entities110)) ~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\spacy\language.py in __call__(self, text, disable, component_cfg) 435 DOCS: https://spacy.io/api/language#call 436 """ --> 437 doc = self.make_doc(text) 438 if component_cfg is None: 439 component_cfg = {} ~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\spacy\language.py in make_doc(self, text) 462 def make_doc(self, text): 463 if len(text) > self.max_length: --> 464 raise ValueError( 465 Errors.E088.format(length=len(text), max_length=self.max_length) 466 ) ValueError: [E088] Text of length 6820215 exceeds maximum of 3174482. The v2.x parser and NER models require roughly 1GB of temporary memory per 100,000 characters in the input. This means long texts may cause memory allocation errors. If you're not using the parser or NER, it's probably safe to increase the `nlp.max_length` limit. The limit is in number of characters, so you can check whether your inputs are too long by checking `len(text)`.
tokens = nlp(''.join(str(transporte_haddad.clean_lem.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/transporte_haddad.txt", "w") as output:
output.write(str(entities110))
entities110
--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-53-ed63f04f0a8b> in <module> ----> 1 tokens = nlp(''.join(str(transporte_haddad.clean_lem.tolist()))) 2 items = [x.text for x in tokens.ents] 3 entities110 = Counter(items).most_common(200) 4 with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/transporte_haddad.txt", "w") as output: 5 output.write(str(entities110)) ~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\spacy\language.py in __call__(self, text, disable, component_cfg) 435 DOCS: https://spacy.io/api/language#call 436 """ --> 437 doc = self.make_doc(text) 438 if component_cfg is None: 439 component_cfg = {} ~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\spacy\language.py in make_doc(self, text) 462 def make_doc(self, text): 463 if len(text) > self.max_length: --> 464 raise ValueError( 465 Errors.E088.format(length=len(text), max_length=self.max_length) 466 ) ValueError: [E088] Text of length 13406503 exceeds maximum of 3174482. The v2.x parser and NER models require roughly 1GB of temporary memory per 100,000 characters in the input. This means long texts may cause memory allocation errors. If you're not using the parser or NER, it's probably safe to increase the `nlp.max_length` limit. The limit is in number of characters, so you can check whether your inputs are too long by checking `len(text)`.
tokens = nlp(''.join(str(transportes_doria_covas.clean_lem.tolist())))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/transportes_doria_covas.txt", "w") as output:
output.write(str(entities110))
entities110
--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-54-bbf6c1068fc7> in <module> ----> 1 tokens = nlp(''.join(str(transportes_doria_covas.clean_lem.tolist()))) 2 items = [x.text for x in tokens.ents] 3 entities110 = Counter(items).most_common(200) 4 with open("C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/transportes_doria_covas.txt", "w") as output: 5 output.write(str(entities110)) ~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\spacy\language.py in __call__(self, text, disable, component_cfg) 435 DOCS: https://spacy.io/api/language#call 436 """ --> 437 doc = self.make_doc(text) 438 if component_cfg is None: 439 component_cfg = {} ~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\spacy\language.py in make_doc(self, text) 462 def make_doc(self, text): 463 if len(text) > self.max_length: --> 464 raise ValueError( 465 Errors.E088.format(length=len(text), max_length=self.max_length) 466 ) ValueError: [E088] Text of length 10409982 exceeds maximum of 3174482. The v2.x parser and NER models require roughly 1GB of temporary memory per 100,000 characters in the input. This means long texts may cause memory allocation errors. If you're not using the parser or NER, it's probably safe to increase the `nlp.max_length` limit. The limit is in number of characters, so you can check whether your inputs are too long by checking `len(text)`.
import seaborn as sns
import os
import matplotlib.pyplot as plt
import networkx as nx
from collections import Counter
import json
def plot_ner(j):
# Create NER
#tokens = nlp(''.join(f'{j}.clean_lem.tolist()'))
items = [x.text for x in tokens.ents]
entities110 = Counter(items).most_common(200)
#Plot bars
x_val = [x[0] for x in entities110[:5]]
y_val = [x[1] for x in entities110[:5]]
sns.set_theme(style="whitegrid")
#tips = sns.load_dataset("tips")
sns.set(rc={'figure.figsize':(24,16)})
plt.title(f'{j}')
#plt.xlabel("Notas")
#plt.ylabel("Count")
plt.xticks(rotation=75)
ax = sns.barplot(x=[x[0] for x in entities110[:10]], y=[x[1] for x in entities110[:10]])
plt.savefig(f"C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/fig/{j}.png", bbox_inches='tight')
plt.show()
children = sorted(entities110[:20], key=lambda x: x[1])
parent = children.pop()[0]
G = nx.Graph()
widths = nx.get_edge_attributes(G, 'weight')
fig, ax = plt.subplots(nrows=1, ncols=1)
for child, weight in children: G.add_edge(parent, child, weight=weight)
width = list(nx.get_edge_attributes(G, 'weight').values())
nx.draw_networkx(G, width=width, arrows = True, style = 'solid' #solid|dashed|dotted,dashdot
, node_shape='8', node_size=500, node_color='#1f78b4', edge_color='lightblue' #'so^>v<dph8'
, alpha=0.6)
#ax.set_facecolor("#008B8B")
#ax.axis('off')
plt.title(f'{j}')
fig.set_facecolor('lavender') #lightsteelblue
plt.box(False)
plt.savefig(f"C:/Users/user/Documents/1. GitHub/Projeto 5-NLP-SP-City-Hall/Entities txt/fig/{j}_grapho.png")
plt.show()
from IPython.display import Audio, display
def allDone():
display(Audio(url='https://sound.peal.io/ps/audios/000/000/537/original/woo_vu_luvub_dub_dub.wav', autoplay=True))
tokens = nlp(''.join(str(assistencia_social_doria_covas.lemma.tolist())))
plot_ner('assistencia_social_doria_covas')
tokens = nlp(''.join(str(assistencia_social_haddad.lemma.tolist())))
plot_ner('assistencia_social_haddad')
tokens = nlp(''.join(str(controladoria_geral_doria_covas.lemma.tolist())))
plot_ner('controladoria_geral_doria_covas')
tokens = nlp(''.join(str(controladoria_geral_haddad.lemma.tolist())))
plot_ner('controladoria_geral_haddad')
tokens = nlp(''.join(str(cultura_doria_covas.lemma.tolist())))
plot_ner('cultura_doria_covas')
tokens = nlp(''.join(str(cultura_haddad.lemma.tolist())))
plot_ner('cultura_haddad')
tokens = nlp(''.join(str(desenvolvimento_doria_covas.lemma.tolist())))
plot_ner('desenvolvimento_doria_covas')
tokens = nlp(''.join(str(desenvolvimento_haddad.clean_lem.tolist())))
plot_ner('desenvolvimento_haddad')
tokens = nlp(''.join(str(direitos_humanos_doria_covas.lemma.tolist())))
plot_ner('direitos_humanos_doria_covas')
tokens = nlp(''.join(str(direitos_humanos_haddad.lemma.tolist())))
plot_ner('direitos_humanos_haddad')
tokens = nlp(''.join(str(direitos_humanos_poprua_doria_covas.lemma.tolist())))
plot_ner('direitos_humanos_poprua_doria_covas')
#tokens = nlp(''.join(str(direitos_humanos_poprua_haddad.lemma.tolist())))
#plot_ner('direitos_humanos_poprua_haddad')
tokens = nlp(''.join(str(esportes_doria_covas.lemma.tolist())))
plot_ner('esportes_doria_covas')
tokens = nlp(''.join(str(esportes_haddad.clean_lem.tolist())))
plot_ner('esportes_haddad')
tokens = nlp(''.join(str(fazenda_doria_covas.lemma.tolist())))
plot_ner('fazenda_doria_covas')
tokens = nlp(''.join(str(fazenda_haddad.lemma.tolist())))
plot_ner('fazenda_haddad')
tokens = nlp(''.join(str(gestao_haddad.lemma.tolist())))
plot_ner('gestao_haddad')
tokens = nlp(''.join(str(governo_doria_covas.lemma.tolist())))
plot_ner('governo_doria_covas')
#tokens = nlp(''.join(str(governo_haddad.lemma.tolist())))
#plot_ner('governo_haddad')
tokens = nlp(''.join(str(habitacao_haddad.lemma.tolist())))
plot_ner('habitacao_haddad')
tokens = nlp(''.join(str(justica_doria_covas.lemma.tolist())))
plot_ner('justica_doria_covas')
tokens = nlp(''.join(str(justica_haddad.lemma.tolist())))
plot_ner('justica_haddad')
tokens = nlp(''.join(str(meio_ambiente_haddad.lemma.tolist())))
plot_ner('meio_ambiente_haddad')
tokens = nlp(''.join(str(obras_doria_covas.lemma.tolist())))
plot_ner('obras_doria_covas')
tokens = nlp(''.join(str(obras_haddad.lemma.tolist())))
plot_ner('obras_haddad')
tokens = nlp(''.join(str(pessoa_com_deficiencia_doria_covas.lemma.tolist())))
plot_ner('pessoa_com_deficiencia_doria_covas')
tokens = nlp(''.join(str(pessoa_com_deficiencia_haddad.lemma.tolist())))
plot_ner('pessoa_com_deficiencia_haddad')
#tokens = nlp(''.join(str(procuradoria_geral_haddad.lemma.tolist())))
#plot_ner('procuradoria_geral_haddad')
tokens = nlp(''.join(str(relacoes_internacionais_doria_covas.lemma.tolist())))
plot_ner('relacoes_internacionais_doria_covas')
tokens = nlp(''.join(str(relacoes_sociais_doria_covas.lemma.tolist())))
plot_ner('relacoes_sociais_doria_covas')
#tokens = nlp(''.join(str(relacoes_sociais_haddad.lemma.tolist())))
#plot_ner('relacoes_sociais_haddad')
tokens = nlp(''.join(str(seguranca_urbana_doria_covas.lemma.tolist())))
plot_ner('seguranca_urbana_doria_covas')
tokens = nlp(''.join(str(seguranca_urbana_haddad.lemma.tolist())))
plot_ner('seguranca_urbana_haddad')
tokens = nlp(''.join(str(seguranca_urbana_defesa_civil_doria_covas.lemma.tolist())))
plot_ner('seguranca_urbana-defesa_civil_doria_covas')
tokens = nlp(''.join(str(seguranca_urbana_defesa_civil_haddad.lemma.tolist())))
plot_ner('seguranca_urbana-defesa_civil_haddad')
tokens = nlp(''.join(str(seguranca_urbana_guarda_civil_doria_covas.lemma.tolist())))
plot_ner('seguranca_urbana-guarda_civil_doria_covas')
tokens = nlp(''.join(str(seguranca_urbana_guarda_civil_haddad.lemma.tolist())))
plot_ner('seguranca_urbana-guarda_civil_haddad')
tokens = nlp(''.join(str(subprefeituras_doria_covas.lemma.tolist())))
plot_ner('subprefeituras_doria_covas')
tokens = nlp(''.join(str(urbanismo_doria_covas.lemma.tolist())))
plot_ner('urbanismo_doria_covas')
tokens = nlp(''.join(str(urbanismo_haddad.lemma.tolist())))
plot_ner('urbanismo_haddad')
allDone()